中国のDeepSeek、その低コストAIモデルの全て―QuickTake
記事を要約すると以下のとおり。
創業1年余りの中国の人工知能(AI)新興企業であるDeepSeek(ディープシーク)は、世界トップクラスのチャットボットに匹敵する性能を、その数分の1程度のコストで実現する画期的なAIモデルを披露し、シリコンバレーを感心させると同時に慌てさせている。 同社はオープンソースのAIモデルを開発しており、これは開発者コミュニティーの誰もがソフトウエアを検査し、改善することができることを意味する。 このモデルの優れた効率性は、AI開発各社がエヌビディアのような企業から最新かつ最も強力なAIアクセラレーターの入手に多額の資本を投じる必要があるのかという疑問を生じさせる。 ディープシークによると、R1は数学的タスクのAIME2024、一般知識のMMLU、質問応答性能のAlpacaEval2.0など幾つかの主要なベンチマークにおいて、ライバルモデルと同等か、それ以上の性能を発揮しているという。しかし、ディープシークの進歩は、中国の進歩を完全に妨げるものではないことを十分に示した。昨年11月には、人間の思考を模倣するように設計された推論モデル「DeepSeekR1」を世界に披露した。 市場調査会社アップ・フィギュアズのデータによると、ディープシークの創設者はどんな人? 1985年に広東省で生まれた梁氏は、浙江大学で電子工学および情報工学の学士号と修士号を取得した。 梁氏は、さらなる進歩へのボトルネックは資金調達ではなく、米国による最先端チップへのアクセス制限だと、中国国内に構築する必要性を強調した。 「より多くのイノベーションにつながるとは限らない。」李開復(カイフ・リー氏)が率いるAIスタートアップ、零一万物(01.AI)と並んで、ディープシークはオープンソースのアプローチで際立っている。また、より効率的なモデルがはるかに少ない支出で開発できるのであれば、メタやマイクロソフトなどの企業による巨額の支出にも疑問が投げかけられる。 既に世界中の開発者がディープシークのソフトウエアを試用し、それを用いたツールの構築を検討している。ディープシークの欠点は? 他の中国製AIモデルと同様に、ディープシークは中国でセンシティブと見なされるトピックについては自主検閲を行っている。 テストでは、ディープシークのクラウドインフラは、突然の人気によって試されることになるだろう。新規ユーザーや復帰したユーザーがチャットボットにさらに多くのトラフィックを管理しなければならなくなる。
[紹介元] ブルームバーグ マーケットニュース 中国のDeepSeek、その低コストAIモデルの全て―QuickTake