El sitio especializado SemiAnalysis ha acusado a DeepSeek de haber manipulado o distorsionado la información sobre la inversión y la infraestructura utilizada para desarrollar su modelo de IA R1. Según el informe, la empresa china habría invertido más de 1.600 millones de dólares y utilizado una matriz de 50.000 GPU basadas en la arquitectura Hopper de NVIDIA, cifras muy distintas a las que DeepSeek mencionó inicialmente.
En su presentación, DeepSeek afirmó que el modelo R1 fue entrenado con solo 2.048 GPU y tuvo un costo de solo 6 millones de dólares, cifras que han sido cuestionadas desde el principio. SemiAnalysis sostiene que DeepSeek omitió costos clave, como la infraestructura necesaria para soportar el entrenamiento de su IA. Además, el informe detalla que la empresa no posee exclusivamente tarjetas NVIDIA H100, sino una combinación de 10.000 H100, 10.000 H800 y el resto en modelos H20.
DeepSeek sigue mintiendo.
A pesar de estas discrepancias, el informe señala que DeepSeek ha desarrollado su IA con menos recursos que OpenAI y otros gigantes del sector, lo que refuerza su imagen de eficiencia en la industria. También destaca que la empresa no depende de inversores externos ni especuladores, lo que le ha permitido tomar decisiones con mayor rapidez y flexibilidad.
Otro aspecto clave del éxito de DeepSeek ha sido su estrategia de reclutamiento local en universidades de China continental, en lugar de competir por talento en Taiwán o EE.UU. Según el informe, DeepSeek ofrece salarios muy superiores al promedio del mercado, con algunos investigadores ganando más de 1,3 millones de dólares al año, lo que ha contribuido a atraer y retener talento clave en el sector de IA.
Fuente: TechSpot