Openai suspeita que os modelos Deepseek AI da China, significativamente mais baratos que os colegas ocidentais, foram treinados usando os dados do OpenAI. Essa revelação, juntamente com o rápido aumento da popularidade da Deepseek, desencadeou uma dramática desaceleração do mercado para as principais empresas de IA. A NVIDIA, um participante importante na tecnologia GPU crucial para o desenvolvimento do modelo de IA, experimentou sua maior perda de ações de todos os tempos, perdendo quase US $ 600 bilhões em valor de mercado. Outros gigantes da tecnologia como Microsoft, Meta e Alphabet também sofreram declínios significativos.
O modelo R1 da Deepseek, baseado no Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) em comparação com os modelos ocidentais. Embora essa alegação seja contestada por alguns, ela alimentou preocupações sobre os enormes investimentos que as empresas ocidentais estão fazendo na IA. O aumento dos downloads da Deepseek ressalta ainda mais seu impacto.
O OpenAI e a Microsoft estão investigando se a Deepseek violou os termos de serviço da Openai usando sua API ou empregando uma técnica chamada "destilação" - extraindo dados de modelos maiores para treinar os menores. O OpenAI reconhece que as empresas chinesas estão tentando ativamente replicar os modelos de IA de liderar e enfatizar seu compromisso de proteger sua propriedade intelectual (IP) por meio de várias contramedidas e colaboração com o governo dos EUA.
David Sacks, Czar de AI do presidente Trump, apóia a reivindicação de extração de dados, sugerindo que o OpenAI provavelmente implementará medidas para evitar futuras instâncias de destilação.
Esta situação destaca a ironia da posição do Openai, dada sua própria história de usar material protegido por direitos autorais para treinar o ChatGPT. O Openai argumentou anteriormente que a criação de modelos de IA de hoje sem material protegido por direitos autorais é impossível, uma posição apoiada por sua submissão à Câmara dos Lordes do Reino Unido e desafiada por ações judiciais do New York Times e 17 autores alegando violação de direitos autorais. O OpenAI sustenta que suas práticas de treinamento constituem "uso justo". As batalhas legais em torno dos dados de treinamento da IA e direitos autorais continuam a se desenrolar, com um escritório de direitos autorais dos EUA em 2018 declarando que a arte gerada pela IA não pode ser protegida por direitos autorais devido à falta de um "nexo entre a mente humana e a expressão criativa".