En GTC 2025, NVIDIA sigue revolucionando el mundo de la inteligencia artificial con el lanzamiento de Dynamo, su nuevo software de código abierto diseñado para optimizar la inferencia de IA a gran escala. Este sistema promete mejorar la eficiencia de las GPU en centros de datos, maximizando el rendimiento y reduciendo costos operativos.
Según NVIDIA, Dynamo aumentó el rendimiento de sus GPU hasta 30 veces en pruebas con DeepSeek R1 en un clúster GB200 NVL72, lo que supone un gran avance en la generación de tokens y el procesamiento de modelos de IA.
Optimización de GPU con cuatro pilares clave
Para mejorar la inferencia de IA, NVIDIA Dynamo se basa en cuatro pilares clave que optimizan el uso de GPU y aumentan la eficiencia operativa. El Planificador de GPU ajusta dinámicamente la cantidad de unidades utilizadas, evitando desperdicio de recursos y mejorando el rendimiento. Por su parte, el Enrutador inteligente gestiona las solicitudes de inferencia para evitar cálculos redundantes, acelerando así la velocidad de respuesta en los modelos de IA.
Además, la Biblioteca de comunicación de baja latencia facilita la interacción entre múltiples GPUs, permitiendo una transferencia de datos más rápida y eficiente. Finalmente, el Administrador de memoria optimiza el almacenamiento y recuperación de información, reduciendo costos operativos y mejorando el manejo de grandes volúmenes de datos en entornos empresariales y centros de datos.
Disponibilidad y futuro de NVIDIA Dynamo
El software ya está disponible en los microservicios NVIDIA NIM y próximamente se integrará en NVIDIA AI Enterprise, ofreciendo soporte adicional para empresas.
Con esta innovación, NVIDIA reafirma su liderazgo en el sector de IA empresarial, proporcionando herramientas para optimizar el uso de modelos avanzados como Llama y las GPU Hopper.
Fuente: NVIDIA