Operai sospecha que los modelos de AI profundos de China, significativamente más baratos que las contrapartes occidentales, fueron entrenados utilizando datos de OpenAI. Esta revelación, junto con el rápido aumento de la popularidad de Deepseek, provocó una desaceleración del mercado dramático para las principales compañías de inteligencia artificial. NVIDIA, un jugador clave en tecnología GPU crucial para el desarrollo del modelo de IA, experimentó su pérdida de acciones de un solo día más grande, perdiendo casi $ 600 mil millones en valor de mercado. Otros gigantes tecnológicos como Microsoft, Meta y Alphabet también sufrieron disminuciones significativas.
El modelo R1 de Deepseek, basado en el de código abierto Deepseek-V3, cuenta con costos de capacitación significativamente más bajos (estimados en $ 6 millones) en comparación con los modelos occidentales. Si bien algunos lo disputan, algunos han impulsado las preocupaciones sobre las inversiones masivas que las empresas occidentales están haciendo en IA. El aumento en las descargas de Deepseek subraya aún más su impacto.
Operai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAI utilizando su API o empleando una técnica llamada "destilación", extrayendo datos de modelos más grandes para capacitar a los más pequeños. Openai reconoce que las empresas chinas intentan replicar activamente modelos de IA de EE. UU. Y enfatiza su compromiso de proteger su propiedad intelectual (IP) a través de diversas contramedidas y colaboración con el gobierno de los Estados Unidos.
David Sacks, AI Czar del presidente Trump, apoya el reclamo de extracción de datos, lo que sugiere que OpenAI probablemente implementará medidas para evitar futuras instancias de destilación.
Esta situación destaca la ironía de la posición de OpenAi, dada su propia historia de usar material con derechos de autor para entrenar a ChatGPT. Operai ha argumentado previamente que crear los principales modelos de IA de hoy sin material con derechos de autor es imposible, una postura respaldada por su sumisión a la Cámara de los Lores del Reino Unido y desafiada por las demandas del New York Times y 17 autores que alegan infracción de derechos de autor. Operai sostiene que sus prácticas de capacitación constituyen "uso justo". Las batallas legales que rodean los datos de capacitación de IA y los derechos de autor continúan desarrollándose, con un fallo de la Oficina de Derechos de Autor de los Estados Unidos en 2018 que indica que el arte generado por la IA no puede tener derechos de autor debido a la falta de un "nexo entre la mente humana y la expresión creativa".