ChatGPTの開発元は、中国のコスト効率に優れたDeepSeekのAIモデルがOpenAIの独自データを利用して開発された可能性があると懸念を表明しました。
今週、ドナルド・トランプ氏はNVIDIAが時価総額で約6000億ドルを失った後、DeepSeekを「米国 tech企業への警鐘」と評しました。DeepSeekの台頭はAI関連企業の株価大幅下落を引き起こし、AIシステム向けGPU主要サプライヤーのNVIDIAは史上最大となる16.86%の1日下落を記録。これはウォール街史上最大の下落幅です。
その他のtech大手も小幅ながら注目すべき下落を示し、Microsoft、Meta、Alphabetは2.1~4.2%下落、AIサーバーメーカーのDellは8.7%下落しました。
DeepSeekは自社のR1モデルをChatGPTなど西洋のAIサービスに対抗する低価格オルタナティブとして推進。オープンソースのDeepSeek-V3フレームワークを基盤とし、同社は自社システムが大幅に少ない計算資源で600万ドルという低コストのみで訓練されたと主張しています(ただし専門家の一部はこの主張に疑問を投げかけています)。
この急成長する競合は、米国tech企業による巨額のAI投資への投資家信頼を揺るがしました。DeepSeekのユーザーベースは急速に拡大し、その機能への関心の高まりを受けて一時的に米国で最もダウンロードされた無料アプリとなりました。
ブルームバーグによると現在OpenAIとMicrosoftは、DeepSeekがOpenAIのAPIを不正利用して自社モデルを強化したかどうかを調査中です。「中国本土の企業その他が米国をリードするAIシステムから継続的に知識を抽出しようと試みていることを認識しています」とOpenAI広報担当者はブルームバーグに語りました。
調査の焦点は「蒸留」と呼ばれる技術で、開発者がより先進的なシステムからデータを抽出して新モデルを訓練する手法(これはOpenAIの利用規約違反です)。
トランプ氏のAI政策顧問デビッド・サックス氏はFoxニュースにこうコメントしました:「明らかな証拠がDeepSeekがOpenAIモデルから知識を流用したことを示しています。米国AI業界のリーダーたちがこのような行為に対しより強力な保護策を実施すると期待します」
オブザーバーらは、OpenAI自体が訓練データを巡って論争に巻き込まれてきた経緯を考えるとこれらの告発は皮肉だと指摘。Techアナリストのエド・ジトロン氏はツイートしました:「ネット全体をスクレイピングしてChatGPTを構築した企業が、自社の出力を誰かが使う可能性があると文句を言う?この偽善ぶりには呆れる」
OpenAIは以前、著作権のある素材の使用を正当化し、1月に英国議会に「現代AI開発には必然的に著作権コンテンツが関与します。それがなければ、1世紀前のパブリックドメイン作品だけでモデルを訓練することになり、役立たずのシステムしか作れません」と説明していました。
AI訓練データを巡る論争は生成AIの急成長とともに激化。ニューヨーク・タイムズは2023年12月、ジョージ・R・R・マーティン氏ら著作者に続き、著作権侵害でOpenAIとMicrosoftを提訴しました。
法的な不確実性は続いており、2023年の米裁判所判決はAI生成アートに著作権保護を与えられないとする2018年著作権局の立場(保護には人間の創造的関与が必要)を支持しました。