核心原因の一つは、iOS が MAC OS からのカーネルレベルの安定性とマルチタスク能力を継承し、それをオープンエコシステムに仕立て上げたことで、開発者たちはこれらの Apple の基盤能力を自由に統合し、自分自身の革新的なアプリケーションを作成できるようになったことです。これにより、モトローラやノキアといった一部の巨頭によって定義されていた携帯電話の概念が、エコシステム全体が参加する無限の可能性を持つ巨大な産業に変わり、その結果、10年以上のモバイルインターネットの扉が開かれました。
その中で、MCP Server 部分の基盤インフラは、コアコンポーネントとして Chatfile plus を持ち、主な機能は知識化フレームワークを通じて、異なるモーダル、異なる形態、異なるフォーマットのコンテンツを要素レベルで分解・解析処理し、多モーダル理解、多モーダル検索、ファイル変換解析などの一連のツールフレームワークコンポーネントを提供することです。
AI ノートは業界初のマルチモーダル AI ノートで、ユーザーが百度ネットワークドライブに保存したさまざまな大学院入試学習動画とノートページを同じインターフェースに統合し、スムーズな連動を実現します。また、動画内容とノートは相互に強く関連しており、動画を見て、AI ノートを生成し、AI マインドマップをまとめ、最後に AI 出題で学習成果を検証するというプロセスを通じて、ユーザーの学習の全周期を完全にカバーしています。
「無所不能、無処不在」のAIを構築するために、百度はなぜ「オペレーティングシステム」から始めるのか?
作者:ポンプの極客
大モデルは中国の五千年の歴史を整理することができるが、今何時かを答えることができない;量子力学が何であるかを明確に説明できるが、専門的な図文を豊富に含んだPPTを作成することすら非常に難しい。
なぜ大規模モデルは無敵に見えるのに、実際に使うといつも少し物足りないのでしょうか?
理由は簡単です。賢く、博学であることは、働けることを意味しません。
賢い、大規模なモデルが膨大な知識を通じて訓練・学習し、発達した脳を持ち、質問にうまく答えることができる。
そして、同時に賢さと有能さの2つの要素を満たすためには、この賢い頭脳に柔軟な四肢を合わせて、「深い思考 + 深い提供」を実現する必要があります。
そのため、大規模モデルを「賢い」思考から「賢くて有能」な進化を実現する方法が、この大規模モデルの熱潮が一時的なものであるのか、歴史を変える勝負の手であるのかを決定することになりました。
百度はサンプルを提供しました。
4月25日、Create 2025 百度 AI 開発者大会で、百度の創業者李彦宏が百度文庫と百度網盤が共同で発表した世界初のコンテンツ分野のオペレーティングシステム——沧舟 OSを紹介しました。
Baidu Library と Netdisk が過去に蓄積した基盤技術、機能、データを完全に統合することで、ユーザーにとって最も合理的な形式と最も便利な対話型インターフェイスで、水などのさまざまなシナリオに統合して、低い敷居とエンドツーエンドの高品質の配信を実現できます。
沧舟OSに基づいて、百度文庫と百度網盤がAIに対して抱くビジョンと期待は、いつでも、どこでも、どの端末でも、本当にワンストップでエンドツーエンドの提供を実現し、AIが「無所不能、無処不在」となることです。
01
沧舟 OSは、AIをオペレーティングシステムのレベルで進化させます
テクノロジー産業には、技術が実験室から実際に多くの家庭に普及するためには、長いGartner曲線のプロセスを経る必要があるという共通認識があります。
この曲線において、第一段階の成長は、主に技術の進歩によってもたらされる市場の熱狂的な期待に依存していますが、技術の実現が理想的でない場合、この段階の成長は急速に衰退に入ります。技術の実現に必要な条件が徐々に成熟し、ほぼゼロのハードル、無限の可能性、あらゆる場所に存在するインフラとして具体化されると、第二段階のエコシステムの爆発が訪れるでしょう。
ソフトウェア産業の第二段階の始まりを示す兆候の一つは、通常、成熟したオペレーティングシステムの出現です。例えば、コンピュータ産業におけるWindows、スマートフォン産業におけるiOSのように。
では、成熟したオペレーティングシステムをどのように定義するのか?約15年前、世界のテクノロジー産業では、このような議論がありました:同じくタッチスクリーン操作、大画面スマートフォン、電話をかけることができ、写真を撮ることができ、音楽を聴き、SMSを送信できるのに、なぜAppleやスマートフォンは過去の機能電話とは異なる生物なのか。
核心原因の一つは、iOS が MAC OS からのカーネルレベルの安定性とマルチタスク能力を継承し、それをオープンエコシステムに仕立て上げたことで、開発者たちはこれらの Apple の基盤能力を自由に統合し、自分自身の革新的なアプリケーションを作成できるようになったことです。これにより、モトローラやノキアといった一部の巨頭によって定義されていた携帯電話の概念が、エコシステム全体が参加する無限の可能性を持つ巨大な産業に変わり、その結果、10年以上のモバイルインターネットの扉が開かれました。
技術はどんどん進化していきますが、ビジネスストーリーのプロットは常に似たリズムで繰り返され続けます。スマートフォンOSで検証された基盤の論理は、大規模モデル時代のOS構築においても依然として通用します。
まとめると、3つあります:完全な基盤能力、柔軟な中枢調整、繁栄するアプリケーションサービスエコシステム。ちょうど沧舟OSの三層アーキテクチャに対応しています:基盤インフラ、中枢システム、アプリケーションサービス。ただ唯一の違いは、アプリケーションと中枢、基盤の間の橋が、従来のAPIから、より標準化され、低いハードルのMCPに置き換わったことです。
その中で、MCP Server 部分の基盤インフラは、コアコンポーネントとして Chatfile plus を持ち、主な機能は知識化フレームワークを通じて、異なるモーダル、異なる形態、異なるフォーマットのコンテンツを要素レベルで分解・解析処理し、多モーダル理解、多モーダル検索、ファイル変換解析などの一連のツールフレームワークコンポーネントを提供することです。
同時に、百度文庫とネットワークドライブは公域知識庫、私域知識庫、記憶庫「三大庫」を構築しました。具体的には、百度文庫が多年にわたって蓄積した公域知識データ(公域知識庫)、ネットワークドライブのユーザーが許可した使用の知識データ(私域知識庫)、ユーザーが過去に文庫やネットワークドライブで行った操作の指示、使用習慣、履歴生成記録(記憶庫)を指します。
これらのデータはしばしば異なるモダリティ、異なる形態、異なるフォーマットで呈示されます。その中で、パブリック知識ベースは一般的な知識を提供し、プライベート知識ベースやメモリベースはユーザーの個別データを保存します。
知識化フレームワークにおいて、沧舟 OS は「三大庫」のマルチモーダルコンテンツをベクトル化およびラベル付け処理します。つまり、画像、テキスト、動画、音声、ドキュメントなどの非構造化データを、異なる専門モデルを使用してコンピュータが理解できる多次元ベクトルデータ、つまり一組のトークンに変換します。
そして、中央システムでは、百度文庫とクラウドストレージが「三大器」を独自に開発しました。これは、編集ツール(文書、PPTなどのコンテンツの編集に対応)、リーダー(文書やPPTなどのコンテンツの読書)、プレーヤー(音声・動画の再生)などのツールを統合したものです。
同時に、沧舟 OS は「調度中枢」を通じて、インタラクティブコンポーネント、意図モデル、トランスミッションインフラなどを使用し、ユーザーの記憶と画像データを組み合わせ、モデルを通じてユーザーの意図を理解し、効率的にエージェントを配分します。
最上層には、一連のAIエージェントがあります。「沧舟 OS」は、文庫、オンラインストレージのPPT、AI絵本、AIマインドマップ、AIポスター、AIノート、AIスキャン、AI聞き取りなど、数百種類のAIエージェントを統合しており、生成モードは画像、文章、映像、音声などさまざまなタイプを網羅し、学習やビジネス、生活やエンターテイメントなどのシーンを全面的にカバーしています。また、統合エディタの編集、修正、精緻な調整能力に依存することで、検索とコンテンツ生成の質をより高め、実際の個別タスクのニーズにより適合させることができます。
02
滄州OSでは、
もっと「賢くて有能な」エージェントを作る
最上層のアプリケーションサービスを中心に、百度文庫 & 百度網盤は数億ユーザーによって検証された使いやすい数百のAIエージェントを提供するだけでなく、大量の第三者の専門エージェントも接続して大規模なアプリケーションエコシステムを構築しています。
「ワンストップのAIコンテンツ取得・作成プラットフォーム」として、Baidu Wenkuは4000万人以上の有料ユーザーと9700万人の月間アクティブAIユーザーを抱えている。 また、Baidu Netdiskは「ワンストップコンテンツサービスプラットフォーム」にアップグレードされ、10億人以上のユーザーにサービスを提供し、1,000億GB以上の総容量を使用し、8,000万人以上のAI月間アクティブユーザーを獲得しています。 Baidu Library と Baidu Netdisk は、大型モデルの時代に真の「超生産性」をもたらしました。
会議で、百度文庫と百度クラウドは「沧舟 OS」に基づいて開発された新しい機能「GenFlow 超能搭子」と「AI ノート」を展示しました。
GenFlow 超能搭子は百度文庫 APP が提供する多エージェント協力能力であり、「沧舟 OS」の支援により、コンテンツ生成はマルチタスクの並行処理が可能で、最も包括的で専門的なネットワーク情報やユーザー自身の習慣や好みに基づいて各種タスクの納品を行うことができます。
例えば、ユーザーが結婚式のプランニングをしたいと思っているが、初めの入力はただの一言である:私は五一に海南でアウトドアウェディングを行いたいので、計画案と招待状を作成してください。
要件は一見単純で、履歴テンプレートの空欄を埋めるだけです。 ただし、ユーザー満足度を達成するためには、ユーザーの美的嗜好、予算の期待、プロセスの好みを知る必要があり、メーデー期間中の海南省の天気、人の流れ、会場の分布も知る必要があります。
そして、上記の内容を完遂するためには、ユーザーの過去のチャット履歴、過去のブラウジング履歴、意図認識、全網検索、PPTツールをそれぞれ調整し、ユーザーの意図を分析し、ユーザーの好みを理解し、ツールを自由に組み合わせて、最終的にユーザーに非常に具体的なプロセス、日付、場所、予算、テーマ、実行の詳細、スタイル、スタッフの手配を含む完全な計画を提供する必要があります。
その間、ユーザーが必要とするプランとポスターは相互に組み合わさっているため、両者のすべての情報が一致している必要があり、同じオペレーティングシステムを使用して並行出力する必要があります。
もちろん、AI は一度にすべての人を満足させる成果を生成することはできません。これは、結婚式の計画やポスターなどが編集可能である必要があることを意味します。そして、この能力を支えるのが「沧舟 OS」の融合エディタ機能です。
綿密な思考から綿密なデリバリーまで、GenFlowが市場でほぼ唯一の真の「マルチエージェントコラボレーション」製品であることは間違いありません。 これは、マルチエージェントコラボレーション製品における高コスト、長い生成時間、低効率、安定した提供ができない、複数回の対話を最適化できないという一般的な問題を解決するだけでなく、成熟した製品を直接埋め込み、ユーザーが許可した個人データと組み合わせることで、AIに「全能性とユビキタス」の目標を達成する真のチャンスを提供します。
百度ネットワークの AI ノートは、無数のオフィスワーカーや試験準備をする人々の頼もしい味方です。
AI ノートは業界初のマルチモーダル AI ノートで、ユーザーが百度ネットワークドライブに保存したさまざまな大学院入試学習動画とノートページを同じインターフェースに統合し、スムーズな連動を実現します。また、動画内容とノートは相互に強く関連しており、動画を見て、AI ノートを生成し、AI マインドマップをまとめ、最後に AI 出題で学習成果を検証するというプロセスを通じて、ユーザーの学習の全周期を完全にカバーしています。
例えば、英語の大学院入試が難しいということが最近の話題になっています。ユーザーは英語の大学院入試のための集中復習をしたいと考えています。AIノートは、ユーザーのクラウドストレージに保存されている関連資料をまず検索し、次にオンラインの公開資料から出題ポイントを調査して整理します。しかし、そのプロセスはここで止まるわけではなく、AIノートは過去の試験問題と組み合わせて、自分が生成した出題ポイントを最終確認します。確認された出題ポイントだけが、この基盤の上で思考マップや問題予測を生成することができ、ユーザーの学習進度を加速するのを助けます。
このプロセスでは、関与するツールの使用は、結婚式の計画を行うよりも少なくはありません。例えば、試験会場を探したり、過去問題を探したりするには、全網検索能力が必要です。また、過去問題は通常PDFまたは画像形式で提示され、名師の解説は動画形式で提供されるため、マルチモーダルコンテンツの解析能力が求められます。最終的なマインドマップの生成と試験問題の予測には、大規模モデルの推論能力、マルチモーダルコンテンツ生成能力、異なるコンテンツ間のマッピング関連能力が必要であり、同時にコンテンツ生成の絶対的な正確性を保証する必要があります。
これが「沧舟 OS」のエンパワーメントです。
もちろん、百度は開発者がMCPを全面的に受け入れることをサポートしているため、沧舟OSは百度の内部エコシステムだけにサービスを提供するのではなく、オペレーティングシステムの成長において最も重要な要素は外部への開放であり、広範な開発者の革新能力を刺激することです。
そのため、エコシステムとアプリケーションが最大の価値を発揮できるように、百度文庫と百度ネットワークドライブは「沧舟 OS」に基づいて、MCPを製品とエコシステムのリンクに十分に活用し、MCPサーバー・クライアント・ホストの三層体系を構築し、文庫とネットワークドライブの機能をMCPサーバー形式でオープンにし、MCPクライアントSDKを通じて、より多くの企業ユーザー、開発者、インテリジェントアプリケーションなどのMCPホストの接続を容易にします。
その中で、最も代表的なケースはサムスンのスマートフォンです。サムスンのスマートフォンは、百度文庫のクラウドストレージにファイルのアップロード、ダウンロード、検索、共有、コンテンツ理解などの複数のMCPサーバーを接続しています。
一方で、ユーザーはスマートフォンの音声アシスタントインターフェースを通じて、話すことで直接ファイルのアップロード、クラウドバックアップ、オンライン共有、ドキュメントの要約、そしてコンテンツの質問応答などの機能を実現できます。
一方で、これらのサーバーはサムスンのスマートフォンシステムのクラウドストレージ機能を強化し、スマートフォン自体が大きなファイルや複数のファイルを一括でバックアップおよび共有するのが難しい問題を解決することができます。
例えば、ユーザーがスマートフォンのアルバムで音声アシスタントを呼び出して「昨日オーシャンで撮った写真を百度クラウドにバックアップして、小明の写真を彼に送って」と言うと、関連する写真がユーザーが許可したクラウドアカウントにアップロードされ、共有リンクが生成されます。スマートフォンアシスタントは連絡先を呼び出し、このリンクをSMSで相手のスマートフォンに送信します。リンクをクリックするだけで、ユーザーは直接百度クラウドにアクセスして確認または保存することができます。
疑う余地なく、OSの基盤能力が信頼できるかどうかは、ツールの積み重ねやハイテクの多さによって決まるものではありません。トップレベルのアプリケーションサービスエコシステムの使いやすさ、成熟度、豊富さが、OSの能力を検証するための最良の基準です。
03
OSの物語には終わりがない
資本市場において、投資家に最も認められている企業の種類は「時間の友」と呼ばれています。
いわゆる時間の友とは、企業が正しいことを一度行った後、次にただ続けて行けば、業績が永久機関のように成長し続け、エコシステム開発者も引き続き利益を得られるということです。
そしてオペレーティングシステムは、まさにそのような典型的な永久機関市場です。コンピュータやスマートフォンの市場が存在し続ける限り、マイクロソフト、アップル、グーグルなどのオペレーティングシステムの物語に終わりはありません。
大モデルも同様です。「深い思考 + 深い提供 + 公私データ + MCPエコシステム」が一緒になると、未来は新しい時代のあらゆることができ、どこにでも存在するAIになります。そうなれば、寒武紀の新しい生物の大爆発のように、次々と新しい種が生まれるでしょう。
このプロセスでは、下を見れば百度文庫や百度ネットワークドライブなど、自身の能力の開放が見えます。エコシステムを積極的に受け入れることで、大規模モデルの新しい種の創造者となり、新しいルールの制定者になります。
上を向くと、「沧舟 OS」に基づいて無数の新しいエージェントが創造され、見られ、新しいアプリケーションサービスエコシステムが壮大に噴出している。
そして今、すべての物語は、ちょうど始まったばかりです。