Le modèle d'IA étonnamment abordable de Deepseek défie les géants de l'industrie. La startup chinoise prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, un contraste frappant avec les coûts nettement plus élevés des concurrents. Ce chiffre apparemment bas, cependant, omet des dépenses substantielles comme la recherche, le raffinement, le traitement des données et les infrastructures.
L'approche innovante de Deepseek exploite plusieurs technologies clés: prédiction multi-token (MTP) pour une précision et une efficacité améliorées; Mélange d'experts (MOE) avec 256 réseaux de neurones pour une formation et des performances accélérées; et l'attention latente multi-tête (MLA) pour se concentrer sur les éléments cruciaux des phrases.
Image: esigame.com
Contrairement aux chiffres médiatiques de Deepseek, la semianalyse révèle une infrastructure de calcul massive impliquant environ 50 000 GPU de trémie NVIDIA, y compris les unités H800, H100 et H20, réparties sur plusieurs centres de données. L'investissement total du serveur est estimé à 1,6 milliard de dollars, les coûts opérationnels atteignant 944 millions de dollars.
Image: esigame.com
Deepseek, une filiale du hedge fund de haut niveau, possède ses centres de données, contrairement aux concurrents de Cloud, en lui accordant un plus grand contrôle et une mise en œuvre plus rapide de l'innovation. Son statut autofinancé contribue à l'agilité et à la prise de décision rapide. La société attire les meilleurs talents, certains chercheurs gagnant plus de 1,3 million de dollars par an, principalement des universités chinoises.
Image: esigame.com
Alors que la demande de coût de formation de 6 millions de dollars de Deepseek est trompeuse, son investissement global dépasse 500 millions de dollars. Sa structure Lean permet un déploiement efficace de l'innovation, contrastant avec des entreprises plus grandes et plus bureaucratiques. Le succès de l'entreprise dépend de l'investissement substantiel, des progrès technologiques et d'une équipe qualifiée.
Image: esigame.com
L'histoire de Deepseek présente une entreprise d'IA indépendante bien financée en concurrence avec succès avec les leaders de l'industrie. Cependant, le récit de la rentabilité révolutionnaire nécessite une compréhension nuancée, compte tenu de l'investissement global substantiel. Le contraste reste brutal, cependant: le modèle R1 de Deepseek a coûté 5 millions de dollars pour s'entraîner, par rapport aux 100 millions de dollars de ChatGPT4. Malgré les dépenses clarifiées, l'efficacité de Deepseek présente toujours un défi convaincant à l'ordre établi.