Os desenvolvedores do ChatGPT levantaram preocupações de que os modelos de IA de baixo custo da DeepSeek chinesa possam ter sido desenvolvidos usando dados proprietários da OpenAI.
Esta semana, Donald Trump descreveu a DeepSeek como um "alerta" para as empresas de tecnologia dos EUA após a Nvidia perder quase US$ 600 bilhões em valor de mercado. A ascensão da DeepSeek provocou quedas significativas nas ações de empresas focadas em IA. A Nvidia, principal fornecedora de GPUs para sistemas de IA, sofreu uma queda histórica de 16,86% em um único dia - a maior da história de Wall Street.
Outros gigantes da tecnologia tiveram quedas menores, mas notáveis, com Microsoft, Meta e Alphabet caindo entre 2,1% e 4,2%, enquanto a fabricante de servidores de IA Dell registrou queda de 8,7%.
A DeepSeek promove seu modelo R1 como uma alternativa econômica aos serviços de IA ocidentais como o ChatGPT. Construído na estrutura de código aberto DeepSeek-V3, a empresa afirma que seu sistema requer significativamente menos poder computacional e foi treinado por apenas US$ 6 milhões - embora alguns especialistas questionem essas afirmações.
Esta concorrência repentina abalou a confiança dos investidores nos grandes investimentos em IA das empresas americanas. A base de usuários da DeepSeek expandiu-se rapidamente, tornando-se brevemente o aplicativo gratuito mais baixado nos EUA diante do crescente interesse em suas capacidades.
A Bloomberg agora relata que OpenAI e Microsoft estão investigando se a DeepSeek usou indevidamente a API da OpenAI para melhorar seus próprios modelos. "Estamos cientes de que empresas baseadas na RPC e outras tentam continuamente extrair conhecimento dos principais sistemas de IA dos EUA", disse um porta-voz da OpenAI à Bloomberg.
O escrutínio foca em uma técnica chamada "destilação", onde desenvolvedores treinam novos modelos extraindo dados de sistemas mais avançados - uma violação dos termos de serviço da OpenAI.
David Sacks, conselheiro de política de IA de Trump, comentou à Fox News: "Evidências claras sugerem que a DeepSeek apropriou-se de conhecimento dos modelos da OpenAI. Espero que os líderes de IA dos EUA implementem proteções mais fortes contra tais práticas."
Observadores destacam a ironia dessas acusações, considerando as próprias controvérsias da OpenAI sobre dados de treinamento. O analista de tecnologia Ed Zitron tuitou: "A empresa que construiu o ChatGPT raspando toda a internet agora reclama quando alguém pode usar suas saídas? A hipocrisia é impressionante."
A OpenAI já defendeu seu uso de material com direitos autorais, dizendo aos legisladores britânicos em janeiro: "O desenvolvimento moderno de IA necessariamente envolve conteúdo protegido - sem isso, só poderíamos treinar modelos em obras de domínio público centenárias, criando sistemas inúteis."
O debate sobre dados de treinamento de IA intensificou-se junto com o rápido crescimento da IA generativa. O New York Times processou OpenAI e Microsoft em dezembro de 2023 por suposta violação de direitos autorais, após litígios anteriores de autores como George R.R. Martin.
Incertezas legais persistem, conforme demonstrado por uma decisão judicial de 2023 nos EUA que determinou que arte gerada por IA não pode receber proteção de direitos autorais, mantendo uma posição de 2018 do Copyright Office que exige contribuição humana criativa para proteção.