Los desarrolladores de ChatGPT han expresado preocupación de que los modelos de IA económicos de DeepSeek en China podrían haberse desarrollado utilizando datos propietarios de OpenAI.
Esta semana, Donald Trump describió a DeepSeek como una "llamada de atención" para las empresas tecnológicas estadounidenses después de que Nvidia perdiera casi 600.000 millones de dólares en valor de mercado. El ascenso de DeepSeek provocó fuertes caídas en las acciones de empresas enfocadas en IA. Nvidia, el principal proveedor de GPU para sistemas de IA, sufrió una histórica caída del 16,86% en un solo día, la mayor en la historia de Wall Street.
Otros gigantes tecnológicos registraron pérdidas menores pero notables: Microsoft, Meta y Alphabet cayeron entre un 2,1% y un 4,2%, mientras que el fabricante de servidores de IA Dell bajó un 8,7%.
DeepSeek promociona su modelo R1 como una alternativa asequible frente a servicios occidentales de IA como ChatGPT. Construido sobre el framework de código abierto DeepSeek-V3, la empresa afirma que su sistema requiere significativamente menos potencia computacional y fue entrenado con solo 6 millones de dólares, aunque algunos expertos cuestionan estas afirmaciones.
Esta repentina competencia ha sacudido la confianza de los inversores en las enormes inversiones en IA de las empresas tecnológicas estadounidenses. La base de usuarios de DeepSeek se expandió rápidamente, convirtiéndose brevemente en la aplicación gratuita más descargada en EE.UU. debido al creciente interés en sus capacidades.
Bloomberg informa ahora que OpenAI y Microsoft están investigando si DeepSeek utilizó indebidamente la API de OpenAI para mejorar sus propios modelos. "Sabemos que empresas con sede en China y otros actores intentan continuamente extraer conocimiento de los sistemas líderes de IA estadounidenses", declaró un portavoz de OpenAI a Bloomberg.
El escrutinio se centra en una técnica llamada "destilación", donde los desarrolladores entrenan nuevos modelos extrayendo datos de sistemas más avanzados, lo que viola los términos de servicio de OpenAI.
David Sacks, asesor de políticas de IA de Trump, comentó a Fox News: "Hay evidencia clara de que DeepSeek se apropió de conocimiento de los modelos de OpenAI. Espero que los líderes estadounidenses en IA implementen protecciones más fuertes contra estas prácticas."
Observadores destacan la ironía de estas acusaciones, considerando las propias controversias de OpenAI sobre datos de entrenamiento. El analista tecnológico Ed Zitron tuiteó: "¿La empresa que construyó ChatGPT raspando todo internet ahora se queja cuando alguien usa sus resultados? La hipocresía es asombrosa."
OpenAI defendió previamente su uso de material con derechos de autor, declarando en enero a legisladores británicos: "El desarrollo de IA moderna necesariamente involucra contenido protegido; sin él, solo podríamos entrenar modelos con obras de dominio público centenarias, creando sistemas inútiles."
El debate sobre los datos de entrenamiento de IA se ha intensificado junto con el rápido crecimiento de la IA generativa. The New York Times demandó a OpenAI y Microsoft en diciembre de 2023 por presunta infracción de copyright, tras litigios previos de autores como George R.R. Martin.
Las incertidumbres legales persisten, como lo demuestra un fallo de 2023 de un tribunal estadounidense que dictaminó que el arte generado por IA no puede recibir protección de derechos de autor, respaldando una postura de 2018 de la Oficina de Copyright que exige aporte creativo humano para protección.