Openai podejrzewa, że modele Deepeek AI w Chinach, znacznie tańsze niż zachodnie odpowiednicy, zostały przeszkolone przy użyciu danych Openai. To objawienie, w połączeniu z szybkim wzrostem popularności Deepseek, wywołało dramatyczne spowolnienie rynku dla dużych firm AI. Nvidia, kluczowy gracz technologii GPU kluczowy dla rozwoju modeli AI, doświadczył największej w historii jednodniowej straty akcji, tracąc prawie 600 miliardów dolarów wartości rynkowej. Inni giganci technologiczni, tacy jak Microsoft, Meta i Alphabet, również doznały znacznych spadków.
Model R1 Deepseek, oparty na open source Deepseek-V3, ma znacznie niższe koszty szkolenia (szacowane na 6 milionów dolarów) w porównaniu z modelami zachodnimi. Chociaż niektóre roszczenie jest kwestionowane przez niektórych, podsyciło obawy dotyczące ogromnych inwestycji, które wchodzą zachodnie firmy w sztucznej inteligencji. Wzrost pobierania Deepseek dodatkowo podkreśla jego wpływ.
Openai i Microsoft badają, czy DeepSeek naruszyło warunki usług Openai za pomocą interfejsu API lub stosując technikę o nazwie „destylacja” - wyodrębniając dane z większych modeli w celu szkolenia mniejszych. Openai przyznaje, że chińskie firmy aktywnie próbują powtórzyć wiodące modele AI i podkreślają swoje zaangażowanie w ochronę własności intelektualnej (IP) poprzez różne środki zaradcze i współpracę z rządem USA.
David Sacks, AI CZAR prezydenta Trumpa, popiera roszczenie o ekstrakcję danych, sugerując, że Openai prawdopodobnie wdroży środki zapobiegające przyszłym wystąpieniu destylacji.
Ta sytuacja podkreśla ironię pozycji Openai, biorąc pod uwagę własną historię używania materiałów chronionych do szkolenia Chatgpt. Openai wcześniej argumentował, że tworzenie dzisiejszych wiodących modeli AI bez materiałów chronionych prawem autorskim jest niemożliwe, stanowisko poparte jego poddaniem się Izbie Lordów Wielkiej Brytanii i kwestionowane przez procesy sądowe New York Times i 17 autorów zarzucających naruszenie praw autorskich. Openai utrzymuje, że jego praktyki szkoleniowe stanowią „dozwolone użycie”. Bitwy prawne wokół danych szkoleniowych i praw autorskich nadal się rozwijają, a orzeczenie o prawach autorskich w USA w 2018 r. Stwierdzono, że sztuki generowanej przez AI nie można chronić chronione prawem autorskim z powodu braku „nexusa między ludzkim umysłem a twórczą ekspresją”.