生成AIの領域で、ごく初期段階の技術スタックが生まれている。無数のスタートアップがこの市場に押し寄せ、基礎モデルの開発、AIネイティブのアプリケーション開発、そして立ち上げに必要なインフラ/ツール提供を行っている。
世の中が熱狂するテクノロジーの多くは、いつも過度な期待が先行し、市場が追いつくのはずっとあとのことになる。だが生成AIのブームには現実の市場での目にみえる利益が伴い、現実の企業から本物のトラクション(引き合い)がある。Stable DiffusionやChatGPTのようなモデルはかつてないほど短期間で利用が拡大し、発表から1年もたたないうちに年間売上が1億ドルを超えるアプリケーションもいくつかある。タスクによっては生成AIが人間のパフォーマンスを何倍も上回るものもある。
これまでの初期データを見ただけでも、世の中をガラリと変えるような転換が起きつつあると言っていいだろう。そこで私たちがまだ知らないこと、そして何よりも一番知りたいことは、「この市場のどこに価値が蓄積するのか」という問いへの答えだ。
昨年1年をかけて、私たちは生成AIに直接関わる大企業の運用者やスタートアップの創業者数十人と面談してきた。この市場での今のところの一番の勝ち組はおそらくインフラストラクチャー事業者で、生成AI市場に流れ込む資金の大半がインフラ企業の懐(ふところ)に入っている。アプリケーション企業は急速に売上を伸ばしているものの、リテンションにも差別化にも利益確保にも苦労している。一方モデルプロバイダーは生成AI市場の存在そのものを背負っているものの、商業的な規模拡大には至っていない。
ということは、一番価値を生み出している企業群ーたとえば、生成AIモデルを学習し、新しいアプリケーションに応用する企業ーはまだ儲かっていないのだ。次に何が起きるかはさらに予想しにくい。だが鍵になるのは、この市場のどの部分に真の差別化が存在し、どこに優位性が確立できるのかを知ることである。この点が市場構造に大きく影響し(たとえば水平統合対垂直統合)、長期的な価値の源泉となる(たとえば利益率とリテンション)。今のところは、既存大手が持つこれまでの優位性以外には、市場のどこにも構造的な競争優位は確立されていないようだ。
私たちは生成AIをとんでもなく強気に見ているし、生成AIがソフトウェア産業にも、またそれ以外にも大きなインパクトをもたらすと信じている。生成AI業界の市場構造を描き出し、そのビジネスモデルに関わる大きな問いに答えるのが、このブログの目指すところだ。
生成AI市場(スタック)を俯瞰する:インフラストラクチャー、モデル、アプリケーション
生成AI市場がどのように形作られつつあるかを理解するためにはまず、その構造をきちんと把握するところからはじめないといけない。
今のところは以下のような感じだろうか。
初期段階にある生成AIスタック
生成AIスタックは3層に分けられる。
アプリケーション:生成AIをユーザー向けプロダクトに組み入れる。独自モデルを走らせるもの(いわゆるエンドツーエンドのアプリケーション)もあれば、外部APIに依存するものもある
モデル:AIプロダクトを動かす。独自APIとして提供されるものもあれば、オープンソースのチェックポイントとして提供されるものもある(その場合にはホスティングのソリューションが必要になる)
インフラストラクチャー(クラウドプラットフォーム、ハードウェア製造企業など):生成AIに学習と推論を行わせる
ひとつ念を押しておくが、これは市場のカオスマップではない。生成AI市場を分析するためのフレームワークだと思ってほしい。ここではそれぞれのカテゴリーでよく知られた企業の例をいくつか挙げている。包括的なリストを作るつもりはないし、これまでにリリースされた非常に優れたアプリケーションをすべて網羅するつもりもない。またMlopsやLLMopsについても深掘りしない。それらのツールについては標準化が進んでいないので、またの機会に書くことにしよう。
生成AIアプリケーションの第1群はそろそろスケールしつつあるが、リテンションと差別化はできていない
これまでのテクノロジーサイクルでは、ユーザーが個人であれ企業であれ、「エンドカスタマーを囲い込む」ことが大規模な独立企業を築くために必須だと当然のように言われていた。生成AIにおいても規模拡大がもっとも狙いやすいのは、エンドユーザー向けアプリケーションだと思われがちだ。だが、そんな過去の通説が当てはまるかどうかはまだ定かでない。
たしかに生成AIアプリケーションの拡大は目覚ましい。これまでにない新鮮味があるし、ユースケースもごまんとあるからだ。実際に、年率換算した売上が1億ドルを超える分野は私たちが見るところで少なくとも3つある。画像生成、文章作成、プログラム作成だ。
とはいえ、ソフトウェア企業の場合、規模拡大しているから長続きするとは限らない。欠かせないのは成長に利益が伴うことだ。つまり、ユーザーや顧客の導入後に利益が確保でき(粗利率が高く)、長期にわたって顧客をつなぎ留めることが必要になる。B2BであれB2Cであれ、技術的な差別化があまりない中では、アプリケーションの長期的な顧客価値はネットワーク効果を通して、またはデータ確保や複雑なワークフローの構築を通して生み出されることになる。
だが、生成AIではこのような前提が必ずしも正しいとは限らない。これまで私たちが見てきたアプリケーション企業の粗利率にはかなりの幅がある。粗利が9割と高い企業もちらほらとはあるものの、ほとんどは5割から6割程度だ。これは推論コストが高いからだ。トップ企業群の成長は著しいものの、今の顧客獲得戦略がスケーラブルかどうかはわからない。有料顧客の獲得効率はすでに下がりはじめているし、リテンションも下がっている。アプリケーションの多くはあまり差別化できていない。それはアプリケーションの背後にあるAIモデルがいずれも似たようなもので、ネットワーク効果もまだあまり実現されておらず、競合他社に真似のできないようなデータ/ワークフローもないからだ。
そんなわけで、持続可能なAIビジネスを築くための唯一の方向性、またはベストな方向性がエンドユーザー向けアプリケーション開発なのかどうかはわからない。言語モデルの競争がさらに進み、効率が向上すれば粗利も改善されるはずだ(この点については以下に記している)。ただのひやかし客が一巡すればリテンションも上がるだろう。そして垂直統合型のアプリケーションが差別化に優位だと考えるもっともな理由もある。だがそこに至るまでに証明すべき点は多い。
生成AIアプリケーション企業が抱えるこれからの課題は次のようなものだ。
・垂直統合(モデル+アプリケーション):AIモデルをサービスとして利用する場合、アプリケーション開発企業は少人数のチームで素早く反復改善が行えるし、テクノロジーが進化するにつれてモデルを入れ替えることもできる。とはいえ、逆の見方をするとモデルがプロダクトそのものであり、ゼロから学習させることによってはじめて優位性が確立されるとも言える。つまり、他社にないデータを何度も学習し続けることによってモート(競争優位)が築かれるわけだ。ただし、そうするにはかなりの資金が必要となり、開発チームも小回りが利かなくなることを覚悟しなければならない。
・アプリケーション対機能開発
生成AIのプロダクトにはありとあらゆる形がある。デスクトップアプリケーション、モバイルアプリケーション、フィグマ/フォトショップのプラグイン、クロームの拡張機能、ディスコードのボットだってある。UIはただのテキストボックス(入力フォーム)なので、ユーザーがすでに利用している何かに埋め込めばいいだけだ。独立企業になれるのはどこだろう? マイクロソフトやグーグルなどすでにAIを統合している既存大手に吸収されるのはどの企業だろう?
・バブルのサイクルを上手く乗り切る
今ある生成AIプロダクトにとってユーザー離脱は折り込み済みとすべきか、それともこれは市場の黎明期だけなのか。AIバブルが落ち着くにつれ、生成AIへの関心も薄れていくのだろうか。こうした問いは次のことを考える上で重要な意味を持つ。いつ資金調達のアクセルを踏むべきか。どれほど積極的に顧客獲得にお金をかけるべきか。どのユーザー層を優先すべきか。プロダクト・マーケット・フィットができたかどうかをいつ明言できるのか。
生成AIの生みの親であるモデルプロバイダーは、いずれも商業的な規模拡大に至っていない
グーグルやOpenAIやStabilityといった企業が優れた研究と技術開発を行っていなければ、今のいわゆる生成AIはこの世に存在していなかった。斬新なモデル構築と、ものすごい努力による学習パイプラインの拡大があったからこそ、私たちは大規模言語モデル(LLM)や画像生成モデルのこれまでにない力の恩恵に預かることができている。
ただし、利用は拡大し大きな話題にはなるものの、それが生み出す収入はまだ意外に少ない。Stable Diffusionは画像生成分野で爆発的にコミュニティを拡大させている。彼らを支えているのは、ユーザーインターフェースやホスティングサービスの存在とファインチューニング方法を含む生態系だ。だがその開発企業であるStabilityは、事業の核である重要なチェックポイントを無料で提供している。自然言語モデルの領域は、ChatGPTとGPT3.5(当ブログ執筆当時)を持つOpenAIの寡占状態にある。だがOpenAI上でキラーアプリケーションと言えるものはあまりなく、価格はすでに一度引き下げられている。
もちろんこれは一時的な現象かもしれない。Stabilityはまだ若い企業でマネタイズに力を入れてはいない。OpenAIはキラーアプリケーションが増えればNLP(自然言語処理)分野の売上の大部分を稼ぎ出す巨大企業になる可能性はある。マイクロソフトのさまざまなプロダクトへの組入れがスムーズに進めば、その可能性は一層高まるだろう。彼らのモデルの莫大な利用価値を考えれば、巨額の売上もそう遠くないかもしれない。
だがこれに逆行する力もある。オープンソースのモデルは誰にでもホストできる。彼らは大規模学習の費用(数百億ドルはくだらない)を負担する必要がない。一方でクローズドソースのモデルがこの先ずっと競争優位性を保てるかどうかはわからない。たとえば、Anthropic、Cohere、Character.aiなどが開発した大規模言語モデルは性能面でOpenAIに近づいているし、同じようなデータセットを学習し、モデルのアーキテクチャもそれほど変わらない。Stable Diffusionの例を見るかぎり、オープンソースのモデルが一定の性能レベルに達し、かつコミュニティーの支持を得ることができれば、そのほかのクローズドモデルが勝つのはおそらく難しいように思える。
モデルプロバイダーについて今のところはっきりとしてきたのは、ホスティングが商業化に結びついているらしいということだ。プロプライエタリAPI(たとえばOpenAI)向け需要の伸びは著しい。オープンソースモデル向けのホスティングサービス(たとえばHagging FaceやReplicate)も立ち上がってきた。おかげでこれまでよりモデルを共有したり統合しやすくなったばかりか、モデルプロバイダーと消費者をつなぐ間接的なネットワーク効果もある。また、エンタープライズ顧客に向けたファインチューニングやホスティング契約で収益化が可能になりそうでもある。
とはいえ、そうしたことのまだ先にモデルプロバイダーが抱えるのは次の課題だろう。
・コモディティ化:AIモデルの性能は、そのうちにいずれもそう変わらなくなると言われる。アプリケーション開発者と話していると、まだそうはなっていないことは明らかで、文章モデルでも画像モデルでもそれぞれに強いリーダー的企業が存在する。だがその強みは独自のアーキテクチャというよりも、莫大な資本やプロプライエタリなデータや希少なAI人材にある。はたしてこれからもずっと同じことが強みになるだろうか?
・卒業リスク:アプリケーション企業を立ち上げて事業を拡大する段階ではモデルプロバイダーの手を借りるのが一番だ。だが規模が一定拡大したところで、自分たちで独自のモデルを開発したりホストしたりするのは理にかなっている。モデルプロバイダーの多くは、少数のアプリケーション企業に売上の大半を頼っている。こうしたお得意様がAIモデルを社内開発に切り替えたらどうなるだろう?
・儲けにこだわるか:生成AIの可能性は果てしなく大きいがその反面、社会に害を与えかねない。そのため、多くのモデルプロバイダーは公益団体(たとえばBコープ)となり、利益の取り分に上限を定めているし、そうでない場合は企業ミッションの中に「世の中のためになる」という使命を明示している。それでも、難なく資金調達はできている。ただし、モデルプロバイダーが、必要とあれば本当に価値を取り込みたい、つまり儲けたいと思っているかどうかについては、議論の余地がありそうだ。
インフラ事業者はすべてに手を伸ばし、果実を刈り取る
ほぼすべての生成AIはどこかの時点でクラウドベースのGPU(またはTPU)を経由することになる。モデルプロバイダーや研究機関がワークロードの学習を行う場合も、ホスティング企業が推論/ファインチューニングを行う場合も、アプリケーション企業がその両方を行う場合もそうだ。生成AIを生かしているのはFLOPS(浮動小数点数演算の回数)である。コンピューティング分野の破壊的なテクノロジーが大規模処理能力によって推し進められるのは、ここしばらくの間なかった現象だ。
ということはつまり、生成AI市場に流れ込む「ものすごい額のカネ」はいずれにしろ最後にはインフラ企業に流れつくことになる。かなり当てずっぽうだが、どのくらいの金額になるかを書いてみよう。私たちの推測では、アプリケーション企業は売上の2割から4割程度を推論と各顧客向けのファインチューニングに使っている。計算処理に応じてクラウドプロバイダーに直接支払う場合もあれば、外部のモデルプロバイダーに支払う場合もある。すると、クラウドプロバイダーやモデルプロバイダーはその売上のおよそ半分をクラウドインフラに支払う。つまり、現在の生成AI市場の総売上の1割から2割がクラウドプロバイダーに行き着くと考えていいだろう。
その上に乗っかるのが、独自モデルを学習させるスタートアップがベンチャーキャピタルから調達した巨額の資金だ。この調達額の大半(アーリーラウンドの8割から9割近くまで)がクラウドプロバイダーに支払われている。上場テクノロジー企業の多くはモデル学習に毎年莫大な投資を行っているが、外部のクラウドプロバイダーを使うこともあれば直接ハードウェア製造企業と共同で行うこともある。
というわけで、「ものすごい額のカネ」というのはそういうことだ。とりわけ、黎明期の市場にとってはとんでもない金額になる。そのほとんどはビッグ3クラウドに行き着く。アマゾン・ウェブ・サービス(AWS)、グーグル・クラウド・プラットフォーム(GCP)、そしてマイクロソフト・アジュールだ。これらクラウドプロバイダーが、包括的で信頼できコスト効率の高いプラットフォームを維持するために行う設備投資額は、合計で年間1兆ドルにのぼる。生成AIの市場ではとりわけ、供給不足が既存巨大企業に有利に働く。彼らなら希少なハードウェア(NvidiaA100やH100GPU)を優先的に手に入れることができるからだ。
ただ面白いことに、それなりに強そうなライバルも出現している。多額の設備投資と販促費を負担できるオラクルのような挑戦者が参入してきた。スタートアップの中でもCoreweaveやLambda Labsは大手モデル開発企業に的を絞ったソリューションによって急速に成長している。彼らはコストが安く、手に入りやすく、個々へのサポートができるという点を打ち出している。また、大手のクラウドサービスがGPU仮想化の制限により仮想マシンのみを提供しているのに対し、こうしたスタートアップはより粒度が細かく抽象化されたリソース(たとえばコンテナ)を提供している。
舞台裏に目を移すと、生成AI領域で一番儲かっているのはワークロードの大部分を一手に引き受けている企業、Nvidiaである。2023年の第3四半期にはデータセンター向けGPU売上が38億ドルにのぼった。生成AIのユースケースのかなりの部分がここに含まれる。しかも、長年にわたってGPUのアーキテクチャに莫大な投資を行い、ソフトウェアの生態系を強化し、学術会での研究利用を幅広く促進してきたおかげで、群を抜いた優位性が築かれている。NvidiaのGPUは、ほかのAIチップを製造するトップのスタートアップすべてを合わせたよりも90倍も頻繁に学術論文に引用されているとも言われる。
もちろんほかにもハードウェアの選択肢がないわけではない。グーグルのTensor Processing Units(TPUs)、AMDのInstinct GPUs、AWSのInferentiaとTrainium チップなどだ。また、Cerebras、Sambanova、Graphcoreといったスタートアップが作るAIアクセラレーター群もある。インテルは後発だが、高価格のHabanaと Ponte Vecchio GPUsで市場に参入している。だがこうした新しいチップで大きな市場シェアを獲得できている企業はほとんどない。例外として注目すべきなのは2社。1社はグーグルで、そのTPUはStable Diffusionのコミュニティで引き合いがあり、大きなGCP案件もいくつか獲得している。もう1社はTSMCで、NvidiaのGPUも含めてここに挙げた半導体のすべてを製造している(インテルは自社製造工場と一部TSMCの工場を使っている)。
言い換えると、生成AI市場の中ではインフラストラクチャーの層(企業群)が儲かるし、持続性と優位性もあるということだ。インフラ企業の課題は以下の通りである。
・ステートレスなワークロードをつなぎ留めることができるか:NvidiaのGPUはどこで借りても性能は変わらない。AIワークロードのほとんどはステートレスである(状態変化を保持せず、一過性)。モデルによる推論作業はデータベースやストレージを伴わなくてもできる(モデルそのもののストレージは別として)。そのため既存のアプリケーションよりもAIのワークロードは持ち運びがしやすくクラウドを変えやすい。だとすると、クラウドプロバイダーはどのように顧客をつなぎ留め、最安値のプロバイダーへの流出を防いだらいいのだろう?
・半導体不足が解消されたら生き延びられるか:クラウドプロバイダーの価格設定も、またNvidia自身の価格設定も、人気GPUの供給不足に支えられている。A100のカタログ価格は発売当初より上がっていると言うプロバイダーもいるが、これはコンピューターハードウェアの世界では極めて珍しい現象だ。増産によって、また/あるいは新たなハードウェアプラットフォームの採用によって今の供給不足が解消されたら、クラウドプロバイダーはどんな影響を受けるだろう?
・挑戦者は壁を突破できるか:より専門性の高い特殊なプロダクトを提供する垂直統合型のクラウドならきっと市場シェアを獲得できるはずだと私たちは思っている。今のところ挑戦者たちはほどほどの技術的な差別化とNvidiaの支援によって、それなりのトラクションを獲得している。Nvidiaにとって既存クラウドプロバイダーは最大顧客であり、生まれつつある新たなライバルでもあるからだ。だがこれだけで、この先ビッグ3のスケールメリットに打ち勝つことができるのだろうか?
とすると、価値はどこに蓄積されるのだろう
もちろん、私たちにも答えはない。ただ、これまで見てきた初期のデータと、初期のAIおよび機械学習スタートアップからの私たちの経験を組み合わせると、次のような勘が働く。
今のところ、生成AI市場には構造的な優位性が存在しないように見える。パッと見た限り、アプリケーションには際立った差別化がないようだ。いずれも似たようなモデルを使っているからだ。モデルが学習するデータセットはほとんど同じだし、アーキテクチャもそれほど変わらない。クラウドプロバイダーも同じGPUを使っているので技術的に際立った差別化は見当たらない。ハードウェア企業でさえも、半導体の製造に使っているのは同じ工場だ。
もちろんこれら以外に通常の差別化要因がないわけではない。規模の優位性(「オレらは資金調達力がすごい!」とか)、サプライチェーンの優位性(「こっちはGPUが確保できるけど、そっちはできないだろ!」とか)、エコシステムの囲い込み(「みんなうちらのソフトウェアを使ってる!」とか)、アルゴリズムの優位性(「こちらの方が賢いんだ!」とか)、販売力(「セールスチームもあるし顧客もいる!」とか)、データパイプラインの優位性(「うちらの方がインターネットを地道に掘り起こしてるよ!」とか)などだ。だがこうした差別化要因のいずれも未来永劫続くものではない。また、いずれの層においても、直接的で強いネットワーク効果が働くかどうかは今の段階ではまだ判断できない。
今手元にあるデータを見ただけでは、生成AI市場で長期にわたって支配的な存在が生まれるかどうかはわからないのだ。
これは奇妙な状態だ。と同時に私たちにとってはそれがチャンスだ。この市場の潜在規模は計り知れない。すべてのソフトウェアを合わせた規模と、人類の努力をすべて集めた規模のあいだのどこかにそれがある。だから、この市場の各層で数多くのライバルが勃興し、健全な競争が繰り広げられるだろうと期待している。また、エンドユーザーとエンドマーケットの要求に最良な形で応えるような垂直型と水平型の企業が成功するだろうとも考えている。たとえば、エンドプロダクトの主な差別化ポイントがAIそのものであれば、垂直統合(自社開発モデルとがっつり結びついたユーザー向けアプリケーション)が有利に働くだろう。一方、AIが大型のロングテールの機能の一部であれば、水平統合が起きるはずだ。もちろん、そのうちに伝統的な差別化要因が築かれることは予想できる。一方で、新たな種類の差別化要因が生まれる可能性もある。
いずれにしろ、生成AIが競争のあり方を変えるのは確かだ。私たちの誰もが今この瞬間に走りながらそのルールを学んでいる。その過程で莫大な価値が生まれるだろう。そして、テクノロジー業界の景色はこれまでとまったく違うものになるはずだ。私たちはそれを待ち望んでいる。
*本ブログ記事の画像はすべてMidjourneyを使って生成した。