Y ahora, con la IA, tenemos otra decisión que afecta a varias áreas: la economía de los tokens, es decir, cómo nuestras estrategias de IA absorben los costes cambiantes de los modelos subyacentes.
Hoy en día, la mayor parte de la IA empresarial depende del uso de APIs de modelos de vanguardia y del pago por los tokens consumidos y generados. Aunque este es un punto de partida sencillo, las cifras están cambiando. El consumo de tokens se está disparando porque los nuevos modelos de razonamiento suelen consumir entre 10 y 20 veces más tokens que los modelos estándar solo por “pensar” en un problema.
A medida que entramos en la era de los agentes de IA, que iteran, usan herramientas y encadenan tareas, ese consumo se multiplica de forma exponencial. Para prosperar en esta nueva economía, las organizaciones deben evolucionar de consumir tokens a producirlos. Eso significa que el éxito pasa por controlar la infraestructura de inferencia, enrutar las consultas de los modelos al punto de acceso más rentable e incluso ejecutar modelos propios, alojados internamente, optimizados para las necesidades específicas del negocio.
En Red Hat, entendemos este recorrido como un camino de “Metal to Agents”. Requiere un stack abierto e integrado de extremo a extremo, en el que cada capa —desde los aceleradores físicos de IA hasta los propios agentes— esté conectada y diseñada con la seguridad del sistema como prioridad. Esta base debe dar soporte a un ecosistema diverso de hardware, incluidos NVIDIA, AMD e Intel, así como silicio personalizado de los principales proveedores cloud. Sobre esa capa de hardware se sitúa la infraestructura de IA, empezando por entornos de Linux y Kubernetes centrados en la seguridad, que ofrecen una fiabilidad constante tanto en un rack de servidores como en sistemas en órbita.
El corazón de un sistema de IA es la inferencia, que es el factor decisivo para escalar las estrategias de IA. El liderazgo de Red Hat en proyectos como vLLM y nuestro trabajo en inferencia distribuida con llm-d significa que contamos con una experiencia única para optimizar la ejecución de modelos y el uso de GPU a nivel de software. En aplicaciones reales, ya hemos visto cómo estas tecnologías reducen en 10 veces el tiempo hasta obtener el primer token y triplican la calidad de la respuesta. Sin control sobre el rendimiento y el coste al mismo tiempo, las organizaciones acabarán viéndose obligadas a hacer concesiones que ni los equipos financieros ni los clientes aceptarán.
Los modelos de IA, sin embargo, no conocen qué diferencia a una empresa de las demás si no se les enseña. Por eso la generación aumentada por recuperación, o RAG, y el fine-tuning han convertido la IA en un verdadero factor diferenciador. Las empresas pueden conectar los modelos con su documentación interna y con el historial de sus clientes, creando sistemas que realmente entienden la experiencia y el conocimiento propio de su negocio.
Todo esto ya es el mínimo imprescindible. La frontera actual son los servicios para agentes. Los agentes ya no son experimentos; son el núcleo de la estrategia empresarial moderna. Pero plantean el reto de “Bring Your Own Agent”, en el que desarrolladores, científicos de datos y equipos de marketing utilizan herramientas distintas, desde LangChain hasta OpenClaw. Una estrategia eficaz debe dar soporte a esa diversidad sin perder un control riguroso de TI. Eso significa dotar a cada agente de una identidad verificada, gestionar su ciclo de vida con control de versiones y posibilidad de volver atrás, y apoyarse en estándares emergentes como MCP Services para conectar agentes con herramientas y datos sin crear brechas de seguridad.
Vemos esta visión en la práctica con organizaciones como BNP Paribas, que ha generado casi 600 millones de dólares de valor al industrializar 1.000 casos de uso de IA sobre una plataforma unificada. Han convertido el aprovisionamiento de GPU, antes un cuello de botella de varias semanas, en un servicio que se presta en minutos, demostrando que la velocidad y la soberanía digital pueden coexistir. Del mismo modo, el Marshall Space Flight Center de la NASA ha adoptado estas plataformas unificadas para trasladar miles de cargas de trabajo heredadas a entornos contenerizados, reduciendo los tiempos de despliegue de días a minutos para dar soporte a operaciones críticas en el espacio.
Estos clientes están transformando las estrategias de IA, que dejan de centrarse solo en la eficiencia y el ahorro de costes para convertirse en motores de crecimiento. Sí, queremos ser más eficientes con la IA, pero quedarse sólo ahí es una visión reduccionista. El siguiente salto de la IA es alinearla con el crecimiento; no solo mejorar el resultado neto, sino también impulsar los ingresos.
En última instancia, el objetivo de una estrategia empresarial de IA debería ser que, cuando el mercado vuelva a moverse —y lo hará—, la empresa sea dueña de la plataforma que sostiene lo que realmente importa. No necesita elegir forzosamente entre la potencia de los modelos de vanguardia y la seguridad que aportan el control y la gobernanza. Si apuesta por un stack abierto e integrado, puede tener ambas cosas. Puede ofrecer a sus equipos el acceso a los modelos que necesitan al mismo tiempo que mantiene una postura de seguridad que su equipo de TI pueda defender de verdad. Esa es la única forma de construir una estrategia que juegue a su favor, convirtiendo la velocidad de la disrupción en una ventaja competitiva a largo plazo.
Como os comentamos ayer, Red Hat está presentado en el Summit su visión sobre cómo debe evolucionar la IA empresarial. Para la compañía, ese avance pasa por una plataforma abierta e híbrida que permita desarrollar y operar agentes de IA, modernizar la infraestructura y mantener el control sobre los datos, la seguridad y la gobernanza.
Red Hat plantea una nueva forma de entender la infraestructura empresarial, conectando en una misma arquitectura la IA agéntica, la virtualización y la soberanía digital. La compañía sostiene que la IA no va a escalar solo con modelos más potentes, sino con una base tecnológica capaz de sostenerla de forma fiable, segura y controlada.
De ahí que los anuncios de esta semana apuntan en tres direcciones muy concretas:
● facilitar el desarrollo y el despliegue de agentes de IA sobre una base fiable;
● apoyarse en la automatización, la nube híbrida y la virtualización para modernizar la infraestructura sin obligar a las empresas a empezar de cero;
● reforzar la soberanía digital de las organizaciones con más control sobre los datos, el despliegue y la gobernanza.
Os volvemos a enviar los anuncios más relevantes, aunque todo lo que se ha ido anunciando está disponibles en la sala de prensa del Red Hat Summit.
IA agéntica
● Red Hat AI 3.4
Red Hat refuerza su plataforma de IA para ayudar a las empresas a pasar de los pilotos a la producción, con más gobernanza, observabilidad y control sobre los agentes y los modelos.
● Red Hat AI Factory con NVIDIA amplía el soporte para una nueva clase de agentes autónomos en la empresa
La colaboración entre Red Hat y NVIDIA avanza hacia un entorno más seguro y gobernado para desplegar y operar agentes autónomos a escala empresarial.
● Red Hat lanza nuevas herramientas para desarrolladores de IA agéntica
La compañía amplía su propuesta para facilitar el trabajo local con agentes de IA y conectar ese desarrollo con despliegues de producción en la nube híbrida.
● La paradoja agéntica y el caso de la IA híbrida
Red Hat explica por qué la IA empresarial necesitará una estrategia híbrida para equilibrar coste, rendimiento, control y soberanía.
Virtualización
● La nueva apuesta por la virtualización y por qué la decisión de TI será clave para la próxima década
Red Hat defiende que la virtualización debe verse como una decisión estratégica de infraestructura, clave para modernizar sin romper lo que ya existe.
● Telenet Business recupera su libertad arquitectónica con Red Hat OpenShift Virtualization
El proveedor belga consolida máquinas virtuales y contenedores en una sola plataforma para avanzar hacia una nube privada más moderna y controlada.
● El Jet Propulsion Laboratory de la NASA avanza en las operaciones de sus misiones espaciales con Red Hat OpenShift Virtualization
JPL moderniza su infraestructura crítica sobre una base unificada, flexible y preparada para el futuro.
Soberanía digital
● Red Hat introduce nuevas capacidades de nube soberana y nube privada para impulsar la autonomía digital
La compañía amplía su propuesta para dar a las organizaciones más control sobre sus datos, su infraestructura y su capacidad de decisión.
● EUROCONTROL escala la innovación en gestión del tráfico aéreo y la soberanía digital con Red Hat
Un caso de éxito que muestra cómo una infraestructura abierta puede ayudar a modernizar entornos críticos sin perder control.
● Health Info Net impulsa una sanidad digital soberana con Red Hat y VSHN
Ejemplo de cómo la soberanía digital también es clave en salud, donde el control del dato y la resiliencia operativa son esenciales.