Openai soupçonne que les modèles de l'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, ont été formés à l'aide des données d'Openai. Cette révélation, associée à la montée rapide de la popularité de Deepseek, a déclenché un ralentissement spectaculaire du marché pour les grandes sociétés d'IA. NVIDIA, un acteur clé de la technologie GPU cruciale pour le développement du modèle d'IA, a subi sa plus grande perte d'actions en une journée, perdant près de 600 milliards de dollars de valeur marchande. D'autres géants de la technologie comme Microsoft, Meta et Alphabet ont également subi des baisses importantes.
Le modèle R1 de Deepseek, basé sur l'open source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) par rapport aux modèles occidentaux. Bien que cette affirmation soit contestée par certains, elle a alimenté les inquiétudes concernant les investissements massifs que les entreprises occidentales font en IA. La surtension des téléchargements de Deepseek souligne encore son impact.
OpenAI et Microsoft étudient si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant son API ou en utilisant une technique appelée "distillation" - extraire les données de modèles plus grands pour former des modèles plus petits. OpenAI reconnaît que les entreprises chinoises tentent activement de reproduire les modèles d'IA en tête et soulignent son engagement à protéger sa propriété intellectuelle (IP) par diverses contre-mesures et collaboration avec le gouvernement américain.
David Sacks, le tsar de l'IA du président Trump, soutient la revendication d'extraction des données, suggérant qu'OpenAI mettra probablement en œuvre des mesures pour empêcher les futures cas de distillation.
Cette situation met en évidence l'ironie de la position d'Openai, étant donné sa propre histoire d'utilisation du matériel protégé par le droit d'auteur pour former le chatppt. Openai a précédemment fait valoir que la création de principaux modèles d'IA d'aujourd'hui sans matériel protégé par le droit d'auteur est impossible, une position soutenue par sa soumission à la Chambre des Lords du Royaume-Uni et contestée par des poursuites du New York Times et 17 auteurs alléguant une violation du droit d'auteur. Openai soutient que ses pratiques de formation constituent une «utilisation équitable». Les batailles juridiques entourant les données de formation de l'IA et le droit d'auteur continuent de se dérouler, avec un bureau de droit d'auteur américain de 2018 indiquant que l'art généré par l'AI ne peut pas être protégé par le droit d'auteur en raison de l'absence d'un "lien entre l'esprit humain et l'expression créative".