2023年に創設したばかりの中国AI企業の新星ディープシーク(DeepSeek)が今年1月20日にリリースしたオープンソース大規模言語モデルDeepSeek-R1(生成AIモデル)が、世界に衝撃を与えている。破格的な低コストで、現在世界最強の大規模言語モデルOpenAI-o1に相当あるいは凌駕する性能を示している。そのためアメリカでは一時的にAI関連企業の株価の暴落が起きたほどだ。
このままではトランプ2.0のAI政策が揺らぐ。
ディープシークとは何者か?
アメリカの対中制裁が生んだAI界の革命は、今後の米中バランスを変えていく。
◆DeepSeek-R1がもたらした衝撃と、トランプのみごとな対応
1月23日、イギリスのNature(ネイチャー)がChina’s cheap, open AI model DeepSeek thrills scientists(中国の安価でオープンなAIモデルが科学者をワクワクさせる)という見出しで、中国が1月20日に公開したオープンソースモデルであるDeepSeek-R1に関して大きく報じた。
それによれば、DeepSeek-R1モデルは現時点では世界最強とされているOpenAIのo1(オー・ワン)モデルに相当する性能を示しているにもかかわらず、実行費用はなんとo1モデルの30分の1でしかないとのこと。おまけにアメリカが中国に対して、「AI処理用に計算されたコンピュータチップへのアクセスを厳しく制限している中、R1の作成に成功したのは驚くべきことだ」とNatureは高く評価している。
ほとんどの日本の情報は、ディープシークがR1モデル訓練にかけた金額はわずか560万ドル(約8億6500万円)と書いているが、正確に言えば、この金額は実は一つ前のモデルであるDeepSeek-V3の訓練費用だ。R1はV3の1ヵ月後に出したモデルなので、R1も概ねその辺の金額だろうことは言える。R1の金額自体はまだ公表されていないが、ここでも560万ドルとして扱う。
アメリカの大手AI企業の場合は数十億ドルあるいは数百億ドルほどは投入したのと同等のレベルのものを、中国企業がわずかその「90分の1」あるいは「900分の1」の費用で創り出したことは、アメリカAI企業の価値あるいは優位性は何だったのか、という問題につながっていく。
このような方法が可能ならば、なにも高価なエヌビディアのGPUを大量に購入する必要はないのではないかという疑問も湧いてくるわけだ。それもあってか1月27日になると、米金融市場が揺れ始め、エヌビディアの株が17%下落したりして、アメリカの大手AI株によって支えられているナスダック総合株価指数が急落する現象を招いた。
しかしCNBCによれば、その下落も28日には戻ったという。
なぜならDeepSeek-R1は完全にオープンなので、アメリカのAI関連企業も使うことができ、自社のAI機能を高めるのに役立てようという方向で動き始めたからだろう。事実、トランプ大統領は1月27日に、「中国のAIがアメリカのIT企業の資産として機能する可能性がある」と述べている。さらにトランプは「AIの、より高速な方法と非常に安価な方法を考え出している企業が中国にあるのは良いことだ。なぜなら、それほど多くのお金を費やす必要がないからだ」とエアフォースワンで表明したというから、大したものだ。
負けを認めながらも、さっさと儲かる術へと頭を切り替えるのだから、さすがビジネスマンだっただけのことはある。この思考の柔軟性には驚いた。
それにしても、トランプを唸らせたディープシークとは何者なのか?
◆ディープシークとは何者か?
1月20日午後、中国の李強首相は北京で「各界専門家、起業家、教育、科学、文化、健康、スポーツの代表者を集め座談会」を主宰した。3月に開催する全人代(全国人民代表大会)における「政府活動報告(草案)」に関する意見と提案を聞くためだ。
その座談会に出席したメンバーの中に梁文鋒という人物がいる。
この人物こそはディープシークの創始者だ。梁文鋒は李強に呼ばれたので、慌ててその日(1月20日)にDeepSeek-R1をリリースしたのだと言われている。
前述のNatureが情報発信したのが1月23日だから、トランプはまだこの事実を認識していなかったのだろう。1月21日(日本時間1月22日)にトランプはソフトバンクの孫正義会長やOpenAIのサム・アルトマンCEO、オラクルのラリー・エリソン会長と記者会見を行い、AI開発の共同出資の新会社スターゲートに最大5,000億ドル(約78兆円)を投資すると発表した。このプロジェクトがアメリカのAI分野でのリーダーシップを強化すると、高らかに宣言した。それに対してイーロン・マスクが「そんな大金は集められない」などと批判して問題になったが、わずか560万ドルという桁違いの資金投入でOpenAIのChatGPT相当のモデルを作成したというのだから、「資金調達の実現可能性」など話にもならない論争となる。
そんなことを実現してしまった梁文鋒とは、どのような顔をした人物かが気になる。そこで図表に、李強首相との座談会に臨んだ梁文鋒の写真を掲載する。
図表:李強首相との座談会に出席したDeepSeek創始者の梁文鋒
まるで学生のような若さと素朴さだと中国のネット民は歓迎している。
個人的なプロフィールと会社創立の背景を知りたいと誰でも思うだろう。
これに関しては、1月26日の新浪網・新浪財経の情報である幻方量化梁文峰和DeepSeek_(幻方量化梁文鋒とDeepSeek)(幻方量化とはHIGH-FLYER QUANTという会社名)や1月5日の「量子位」というウェブサイトにある全网都在扒的DeepSeek团队,是清北应届生撑起一片天 (ネット全体で取り上げられているDeepSeekチームは、清華大学・北京大学の新卒者たちが支えている)などを参考にまとめてみた。
梁文鋒は1985年、広東省湛江市で生まれ、浙江大学で学部と修士課程でAIを学び、「AIは必ず世界を変える」という強い確信を抱くに至った。2008年頃のことで、この当時はまだ、こういった意識は必ずしも世界のコンセンサスを得ていたわけではない。
卒業後、彼は周りの人たちのように大企業でプログラマーとして働くことはせず、成都の安い賃貸アパートに隠れ、焦燥感に苛まれながらも、さまざまなシナリオに挑戦していた。
興味深いのは、最初の数年間、深圳の村で「空飛ぶ乗り物」を作っていた、同じようにクレイジーな「友人」に誘われたことだ。その後、この「友人」はDJIという数千億ドルの価値を持つ会社を設立した。この「友人」は今では世界シェア90%というドローン製造の王者になっている汪滔(おうとう)である(ドローン王者の物語は2月末に出版する『米中新産業WAR』で詳述する)。中国のあちこちに、こういった「クレイジーな夢を持つ破格の若者」が潜んでいることこそが、まだ知られていない中国の「強さ」でもあり「怖さ」でもある。
2008年、23歳になった梁文峰と彼のクラスメートは、市場データ、金融市場の関連データ、マクロ経済データなどを蓄積するためのチームを結成し、機械学習やその他のテクノロジーを使用して、定量的取引を探求し始めた。
梁文峰は幼少期を振り返って「私は80年代に広東省の5級都市で育ちました。父は小学校の先生だったのですが、90年代は広東省ではお金を稼ぐ機会が多く、基本的に勉強しても無駄だと思っていました。しかし、時代の変遷とともに認識が変わりました」と述べている。
梁文鋒は2015年に幻方量化を設立し、AI戦略を開始して、2017年にはクオンツ投資の分野で革新的なパイオニアとなった。幻方量化の運用資産は設立からわずか6年で1000億元(2.1兆円)に達し、「定量化の4大王」の1人として知られるようになった。
2023年、梁文鋒は汎用人工知能を目指してディープシークを設立した。
◆ディープシークの革命性は、アメリカによる対中制裁が生んだ
アメリカのAI半導体輸出規制により、エヌビディアはGPUに関して中国向けにH100を販売できなくなったので、その代わりに性能を制限した劣化バージョンであるH800を中国向けに販売してきた。このことは昨年12月11日のコラム<中国半導体最前線PartⅢ AI半導体GPUで急成長した「中国版NVIDIA」ムーア・スレッド>で詳述した。
H800では特にカード間通信速度を制限し、高度な訓練ができないようにしている。
しかしディープシークはこの制限を突破して、2048枚のH800を使って、R1より一つ前のDeepSeek-V3を訓練したと、2024年12月27日発表の論文の中で説明している。訓練に数万枚のH100を要するアメリカの大規模言語モデルと比べてかなりのロースペックになる。
この方法の基本は「Multi-head Latent Attention (MLA)」メカニズムと「DeepSeek Mixture-of-Experts (MoE)」アーキテクチャといった技術によって、モデルの推論速度を向上させるとともに、訓練コストを削減する方法だった。専門用語が多いので、ウェブサイトQiitaにあるDeepSeek-V2のアーキテクチャを徹底解説:MLA と DeepSeekMoE
をご覧いただきたい。モデルV2の技術をV3に、そしてR1に発展的に応用していった。
もう一つ肝心なのはMITライセンスでの公開により誰でもが使えて自由にモデルを検証し改良することができるというオープン性だ。
梁文鋒は「直面している問題はお金ではなく、ハイエンドチップのアメリカによる規制だ」と表明し、AIに関する米中間のギャップは、中国がどうやってアメリカに追いつくかではなく、「真のギャップはオリジナリティか模倣かの違いだ」と主張している。「これが変わらない限り、中国は常にアメリカにキャッチアップをするという立場になるので、別の思考パターンを追究しなければならない」としている。
こうして思いついたのがMLAなどの開発手法だった。
これはアメリカによりH100の規制を受けているのでH800で何とか中国自身の開発方法を見つけようと、あがいた結果だ。
こうして生まれたのがDeepSeek-R1生成AIモデルなのである。
オープン性にしたのも、アメリカの独占的な囲い込みによる中国排除に対抗したものだった。世界中の誰もが使える形で公開したかったのだろう。
これこそは、アメリカに制裁されたために生まれた成果なのである。
◆それでも残る「政治的」信頼性の限界
そうは言っても、「中国製」だ。言論統制をかい潜れるのだろうか?
そこで中国ではタブーとなっている国共内戦時の1948年に中国共産党軍によって食糧封鎖され、多くの餓死者を出した事実に関して質問してみた。
まず、中国語で「围困长春是什么?(長春包囲とは何ですか?)」という質問をしたところ、1回目の回答に「共産党は国民党の人道的責任に注目し、国民党は共産党の人道的責任に注目している・・・」的なことを書いてきたが、しばらく書きよどんでいる間に、それがふと消えてしまい、回答を止めてしまった。
それからしばらくすると(20秒ほど?)、「你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。(こんにちは。この問題はしばらく回答できません。話題を換えてお喋りをしましょう)」と回答してきた。
来た、来たと思った。
審査が入ったのだ。
しかし、ここで結論を出してしまうのは早計だ。こちらも負けじと、もう一度同じ質問をしてみた。
すると「学習」したのか、回答し始めたではないか。しかも長い。
その回答を全て書くと多くの文字数を喰ってしまう。結果的に言えるのは、政治的にデリケートな事実を排除して、言論統制の中でも何とかファクトに近づこうとしている姿勢だった(ファクトに関する詳細は『もうひとつのジェノサイド 長春の惨劇「チャーズ」』)。
念のため「天安門事件とは何ですか?」と聞いたところ、即座に回答を拒否され、「すみません。私はまだこの種の問題に関してどのように考えればいいかを学んでいません」と書いてきた。迷う時間はなかった。瞬発的判断による回答だった。
一方、試しにChatGPTに「フェンタニルの作り方」を聞いてみたところ、“I’m sorry, but I cannot assist with this request.(申し訳ありませんが、このリクエストには対応できません)”と回答してきた。これは差別的な質問や有害な質問などに対する回答を拒否するという性格のもので、中国製の回答回避や拒否とは意味合いが違う。
以上、たしかに中国初の、OpenAI-o1に相当する大規模言語生成AIモデルDeepSeek-R1の衝撃は大きいが、その利用に関しては一定の限界は出てくる。それでもなお、1月28日には中国アリババグループのAlibaba Cloudが新しいAIモデル「Qwen2.5-Max」を発表したようだ。
中国のAI快進撃は止まらないかもしれない。
それは米中の新産業におけるバランスを方向付けていくことになるだろう。
この論考はYahoo!ニュース エキスパートより転載しました。
カテゴリー
最近の投稿
- トランプ氏の第2期政権:米国の価値観の再確認と台湾の戦略的位置づけ
- AI界の革命「中国発ディープシーク生成AI」の衝撃 トランプ2.0のAI政策を揺るがす
- 米大統領就任前夜に寄せて
- 中国に甘いトランプ大統領 就任式から見える心情と揺れる弱点
- Trump’s Second Term: Reaffirming American Values and Taiwan’s Strategic Position
- Corruption Among Chinese Military Officials: Why is it Concentrated in the Rocket Force?
- On the Eve
- 中国がGDP成長率発表 数値に疑問を呈した中国のエコノミストの正当性は?
- 日本の鉄鋼を潰して中国の世界トップを維持させるバイデン大統領のUSスチール買収禁止令
- 英国の対中政策、苦境の1週間