概観 ── 知性が物質に降りる74年の輪郭
機械はやがて、私たちが世界の表面に触れる仕方を変える。けれど世界そのものを変えるのは、機械ではなく、機械を抱き入れた私たちの暮らしのほうである。
— 1964年、トロントの大学で執筆されたメディア論からの1節を踏まえて問いの設定 ── 本書は何を問うのか
本書は、いまから74年先の2100年までを射程に置きながら、ひとつの素朴な問いを縦糸にして編まれている。知性は、画面の向こう側から降りてきて、物質や生命とどのように出会い直すのか。この出会いを、本書ではフィジカルAIと呼ぶ。文字列を生成するだけだった知性が、ロボットの腕で水を注ぎ、温室で苗を整え、海底で配管を補修し、月面で住居をかたちにする。知性が画面のなかで完結する時代から、知性が物質や生命のあいだに腰を下ろす時代へと、世界はゆっくり横滑りしている。
74年という時間幅を引いたのには理由がある。半世紀ではいまの延長線が見えすぎてしまい、100年では予測の枠組みそのものが揺らいでしまう。74年は、現在働き盛りの世代が孫の世代を見届ける長さであり、ひとつの基幹技術が誕生し成熟し陳腐化するのに必要な時間でもある。電気、内燃機関、半導体のいずれもが、立ち上がりから社会の前提として組み込まれるまでに、ちょうどそれくらいの月日を要した。本書はその同じ時間幅を、知性と物質の出会いに当てて素描してみる。鉄道が町と町を縛り直したように、電気が夜の長さを変えたように、知性が物質と出会う74年もまた、いまの私たちが当たり前と感じている生活の輪郭を、根のところから書き換えていくはずである。
「物質と出会う」というやや古めかしい言い方を、本書はあえて選んでいる。性能の指標や市場規模の予測ではなく、機械が世界の手触りを学び、人が機械の身体と並んで暮らすという、もっと根の深い変化を描きたいからである。出会いには、なじみの時間と、すれ違いの場面と、別れの作法とが伴う。本書はその3つを、技術の系譜と社会の動線の両面から並べていく。性能曲線を追うだけでは見落としてしまう、暮らしの肌理のうえに残る痕跡を、なるべく取り逃さずに描きたい。
もうひとつ、本書には控えめな仮説が伏せてある。知性が物質に降りるとき、降ろされる側もまた変わる。人は、機械の手の介入を受けることで、自分の身体の動きを意識し直す。生命科学者は、機械が描いた分子の折りたたみを見て、生命を「設計しうるもの」として捉え直す。都市の住人は、地下で点検し続ける小さな機械の存在によって、街を「絶えず手入れされる生地」として感じ直す。技術の変化と、その技術を受け止める側の感じ方の変化は、表裏一体である。本書はこの裏側の変化のほうにも、つねに視線の半分を残しておきたい。
74年の道程の輪郭
2026年の現在地から眺めると、知性はようやく言葉と画像の境を越え、身体を持ちたいと願い始めたところにある。研究室では視覚と言語と行動を束ねる新しい型のモデルが立ち上がり、工場や倉庫では1日中働く人型機械が静かに数を増やし、生命科学では設計どおりに折りたためるタンパク質が描かれ始めている。とはいえ、まだ多くの場面で機械は触れたものを壊しやすく、見たものを取り違える。世界の手触りを学ぶ授業が、ようやく1年生として始まったところだ。教科書はまだ書かれていないが、最初の生徒たちが、自分の身体で実地に書き始めている。
2030年代に入ると、家庭の台所や病院の廊下に、人と並んで動く機械が現れる。動きはぎこちないが、転倒の心配は減り、声をかければ手を貸してくれる存在になる。2050年前後には、製造現場や農地、医療の現場で、機械と人がひとつの楽団のように呼吸を合わせる体制が広がり、人が指揮者の位置から離れて、機械と一緒に弦を弾く側に下りていく。2075年ごろ、生命を編集する技術と物質を作り直す技術が、知性の助けを借りて手のなかにおさまり、地域ごとに気候や食を作り替える試みが珍しいことではなくなる。そして2100年、月や火星の小さな町、海面下の都市、軌道上の研究所、地上の田園 ── そのいずれもが、知性と人と生命と物質の四者が織りなす一枚の生地として立ち上がっている。本書はこの74年の道程を、夢物語としてではなく、いま走り始めた研究と産業の延長線として描く。
この時間の流れを、本書では7つの局面に区切って辿る。それぞれの局面で、新しく可能になることと、なおも難しいままに残ることがある。たとえば最初の局面では、家のなかで安全に動けるかどうかが分かれ目になる。中盤の局面では、人と機械が責任を分け持つ仕組みを社会が用意できるかが分かれ目になる。後半の局面では、生命や気候や鉱物資源といった、これまで人の手に余ると考えられてきた領域に、知性をどこまで降ろしてよいのかという問いが、技術の問題から倫理の問題へと重心を移していく。74年はひとつながりの時間でありながら、節ごとに問いの色が変わる時間でもある。
8系統の合流 ── ひとつの場に集まる科学
フィジカルAIは、単独の学問のなかで芽生えたものではない。少なくとも8つの系統が、それぞれ別の谷を下ってきて、ひとつの川に合流しつつある。第1に、ものを動かす身体を扱ってきたロボット工学。第2に、関節やモータを揺れなく操る制御工学。第3に、データから法則を見出す機械学習。第4に、言葉と画像と動作を束ねる基盤モデルの系譜。第5に、仮想空間で世界を先に試すシミュレーション科学。ここまでが、いわゆる情報技術の流れである。
これに、別の流域からの3つの川が合流する。第6に、細胞や酵素を素材として扱う合成生物学。第7に、分子の配列を設計する材料科学。第8に、人の知覚や記憶や情動を解き明かそうとしてきた認知科学。前者の5系統が知性に身体を与え、後者の3系統が知性に生命と物質と心の感覚を与える。この8つの川が、2030年代を通じて合流し、2040年代には1本の太い流れとなる。本書では、その合流の地形と水量と速度を、8系統それぞれの上流まで遡って描いていく。合流地点には、いま誰も名前を与えていない景色が広がるはずだ。
8系統の合流をひとつの場で実現するための、目には映りにくい基盤も同時に厚くなっていく。膨大な計算を支える電力と冷却、世界各地の研究を束ねる試料と標本の輸送網、機械が事故を起こしたときに責任を分け持つ法と保険、機械が読み書きする共通の語彙、人と機械の身体差を埋める安全基準。こうした下支えの整備が遅れる場所では、いくら良い研究が育っても、社会の側が知性と物質の出会いを抱き止めきれない。本書では、技術の合流と並行して、この支えの厚みがどこで先に育ち、どこで遅れるのかも、地図のうえに重ねて描いていく。
生活と社会の組み換え
知性が物質と出会うことは、抽象的な技術論ではない。働き方、食べ方、住まい方、看取り方、学び方のすべてに、輪郭の変化を強いる。製造業では、設計者が頭のなかで描いた図面を、夜のうちに工場が試作し、朝には性能を測り終えている流れができる。失敗の代償が小さくなり、職人の手の感覚が機械の挙動として再現されるようになる。医療では、診察室と薬局と自宅の境目が薄れる。身体に貼られた小さな装置が眠りや血流を読み、機械の手が手術の最後の細かな縫合を担い、薬は工場でなく地域ごとの小さな調剤所で配合される。
農業と食では、土を踏みしめながら作物と向き合う人の隣に、土壌の含水率を読み続ける小さな機械が並ぶ。気候の不安定さに対し、種子と栽培の組み合わせを年ごとに微調整する力が、地域の手に戻ってくる。都市では、道路や上下水の地下空間に小さな点検機械が住み込み、見えない劣化を声に出してくれる。建物は古びる前に手当てされ、街は壊して建て替える文化から、編み直して使い続ける文化へとゆっくり変わる。宇宙では、月面の基地が無人で組み上がり、軌道上の工場が地上では作りにくい結晶を生む。教育では、機械が身体を持って学ぶことを覚えた次の段階として、人もまた身体を通して機械と学び直すことを覚える。これらは別々の物語ではなく、知性が物質と出会う1本の運動が、産業ごとに違う色で染まって見えているにすぎない。
この組み換えは、すべての場所で同じ速さで起きるわけではない。先に走る地域は、研究と資本と人材を引き寄せてさらに速くなり、出遅れた地域は、自前の機械を持てないまま外の機械の利用者にとどまる。74年のあいだに、いまの国境とは別の線が、世界地図のうえに2本も3本も引かれ直すはずである。本書は、その線の引かれ方を、東アジア、北米、欧州、グローバルサウスの順に並べて辿るのではなく、合流の早い領域から遅い領域への横断として描く。地域差を「遅れ」として裁断するのではなく、それぞれの土地が抱える生活の優先順位の違いとして読み直したいからである。
74年後の生活の手触りを、いまの手のなかから引き寄せる。
譜面を書く者の作法
この74年を語るときに、本書がもっとも警戒しているのは、技術礼賛と技術忌避のあいだの、すでにすり減った往復運動である。新しい機械が出るたびに、人は救われると言い、人は奪われると言う。両者は鏡のように似ていて、どちらも未来を一枚の絵で固定してしまう。本書は、その固定から距離を置く。知性と物質の出会いは、現実には速い場所と遅い場所、得をする場所と痛む場所を同時に生み、地域ごと、産業ごと、世代ごとに、まったく違う風景を描く。
本書が立つのは、軌跡を読み、その先に譜面を書く者の立場である。譜面は予言ではない。譜面は、現に走っている研究の方向、すでに動き始めた産業の動線、各地の暮らしの底に流れる価値観の変化、それらを五線譜のうえに重ねて、来年・10年後・30年後の音の重なりを見渡せるようにする道具である。譜面は何度も書き直される。書き直されることを前提にして書かれる。譜面の役割は当てることではなく、各地の演奏者がいまどこを弾いているか、次にどの音へ向かおうとしているかを、互いに確認しあえる地表をつくることにある。本書はそういう譜面のひとつとして読まれることを望む。
譜面を書く者には、ひとつの自制が求められる。自分の見立てを、現実が裏切ったときに、見立てごと書き直す覚悟である。74年のあいだに、本書の図のうちのいくつかは外れるはずだ。けれども外れた事実そのものが、譜面のうえに残された貴重な書き込みとなる。本書は、書き手と読者と未来とのあいだの長い対話の、最初の数小節を提示しているにすぎない。読み終えたあとに残るのは、答えではなく、次に問うべき問いのほうである。
本書の読み方
構成は、序章のあとに、知性と物質の出会いをふたつの峰として描く章、8系統の合流を地形として描く章、合流の先にひらける産業ごとの組み換えを描く章、2030年・2050年・2075年・2100年の朝の場面を解像度高く描く章、そして人と機械が新たに身につける12の能力を描く章へと続く。最後に、いまの研究と産業の現場で起きている小さな波及をいくつかの補論で補い、終章で74年の輪郭を再びひとつの問いに畳み直す。
図解は、文字だけでは見えにくい時間軸と系統の重なりを、目で受け取れるかたちで提示するためにある。図のなかの線は確定した予測ではなく、いま見えている方向の延長線である。読者には、文章と図のあいだを行き来しながら、自分の暮らしの座標を1度、74年の地図のうえに置き直してみてほしい。本書は、楽観も悲観も提示しない。代わりに、知性が物質と出会うこの74年を、立ち止まれる地点と、走り出せる地点と、待つしかない地点に分けて見せようと試みる。それぞれの読者が、自分の足元を確かめ、次の1歩の向きを自分の言葉で決められるように。譜面はここに置く。鳴らすのは、読み終えたあとの、あなた自身の暮らしのほうである。
序章 ── 知性が物質に降りる夜明け
道具は、ある時点で、私たちを使い始める。
— マーシャル・マクルーハン(英 Marshall McLuhan)『メディア論 ── 人間の拡張の諸相』(1964年、ニューヨーク)の警句本書は、フィジカルAIが2026年から2100年までの74年で何を作り、何を組み換え、何を生み出すかを、学術的な蓄積と8系統合流のロードマップで描く。フィジカルAIとは、計算機の内側で完結する知性ではなく、身体を持ち、物理空間で動き、生命と協働し、物質を作り直す知性のことである。汎用ロボット基盤、視覚言語行動モデル、自律実験室、たんぱく質構造予測の進展、細胞由来ロボット、脳-機械接続 ── これらは別々の技術ではない。すべて、知性が画面の向こうから降りてきて、物質と出会う74年の同じ運動の異なる断面である。
本書の射程は5層である。第1に、技術的精緻さ。フィジカルAIの5つの系統(人工知能・機械学習、ロボティクス、生命系、物質系、認知系)が学術的にどう進化してきたかを追跡する。第2に、構造的拡張。5系統が2040年代に8系統オーケストラへ拡張する道筋を示す。第3に、7フェーズの時間軸。第1期(2026-2030 視覚言語行動モデルの基盤定着)から第7期(2090-2100 関係論的物理生態系)までの精緻なロードマップを構築する。第4に、6つの波及分野。製造・医療・農業・都市・宇宙・教育の各領域でフィジカルAIが何を組み換えるかを描く。第5に、4時点の高解像度な未来社会像。2030年・2050年・2070年・2100年の朝、人々がどう生きるかを具体的場面で描く。
本書の基盤は、複数の学術機関と公的統計、そして長期にわたって蓄積されてきた研究論文の集積である。物理学・化学・生物学・工学・認知科学・経済学・人類学・哲学の諸領域を横断し、ある領域の単一の声で語ることをしない。先行するミラツクの詳細な分析結果(『企業活動の現場で求められる人材の未来 2030-2100』を含む一連の研究)が理論的下敷きとなる。本書はそれらと地続きの1冊として、フィジカルAIという1つの主題に焦点を絞って書かれる。
その出会いの74年を、本書は描く。
2026年5月、東京の研究室で、ある工学博士が午前6時に目を覚ます。机のうえには、彼女が3か月前から開発している視覚言語行動モデル(英略 VLA)が、夜のあいだに学習を続けたログを並べている。今朝、彼女がこの同モデルにロボットアームの制御を渡し、コーヒーを淹れさせる予定だ。失敗するかもしれない。だが、3か月前まで「コーヒーを淹れる」という言葉から動作系列を生成することは技術的に不可能だった。いまは可能性が見える。彼女のロボットの腕の先で、知性が物質に降りるその瞬間が、毎朝、世界中の数千の研究室で同時に起きている。これが本書の起点である。
その「同時性」は印象論ではない。公表された世界統計が示すように、計算能力の単価 ── 1ドルで1秒あたりに行える演算回数 ── は1945年から2024年までの79年で、概算で10の20乗倍に改善した。年率にして1.78倍、すなわち年率56%改善で、これはムーアの法則(18か月で倍化)を超える伸びである。人工知能の訓練計算量に絞れば、2012年から2024年の12年で約20倍、年率の指数で約0.7という暴力的な曲線を描く。同じ統計が記録する別の数字も無視できない。501000000人の利用者獲得に、電話は38年、テレビは13年、ウェブは4年、初代スマートフォンは3年を要したが、対話型生成AIサービスは0.17年(約2か月)でそこに到達した。フィジカルAIの社会浸透が、過去のあらゆる技術より高速に走る前提が、すでに整っている。
本書は、序章+10章+終章の12章構成で、約60,000字を目指す。図解18点を伴う。各章は5,000-7,000字を基準とする。本書を読み終えるとき、あなたの目の前の机のうえの空気は、いまと少しだけ違って見えるはずだ。コーヒーカップの取っ手、ノートパソコンの蝶番、窓越しの風 ── これら物質の輪郭が、知性と出会いつつあるという感覚で、薄く揺らいで見えるはずだ。本書は、そのために書かれた。
これら指数曲線の重なりが、74年ロードマップの物理的可能性を規定する。
双子峰の高原とフィジカルAIの位置
私たちは、私たちが作る道具で世界を作り、その世界が今度は私たちを作り返す。
— マーシャル・マクルーハン『メディア論』(1964年、トロント)本書を貫く視点を、最初に置いておきたい。フィジカルAIは、人類史に突然現れた未曾有の特異点ではない。それは過去250年に積み上げられてきた高位高原のうえに、もう1つ立ち上がりつつある峰である。蒸気機関と動力織機が織りなした第1次産業革命以来、技術と社会の高度化は、近代以前との対比でみればすでに高原状態にある。その高原のうえに、まず情報革命の峰がそびえ、いま、人工知能革命の峰が並んで立ち上がっている。フィジカルAIはこの後者の峰の物理側実装である。
ここで「高原」と「峰」という比喩は単なる修辞ではなく、長期的な技術-社会指標から実証的に支持される構造である。バーツラフ・シュミル(英 Vaclav Smil)『エネルギーと文明』(2017年、米マサチューセッツ工科大学出版会)が示すように、人類の1人当たり一次エネルギー消費は、18世紀後半から19世紀後半にかけて約1桁拡大し、20世紀を通じてさらに数倍に伸びた。ロバート・ゴードン(英 Robert Gordon)『アメリカ経済 ── 成長の終焉』(2016年、米プリンストン大学出版会)が示す米国全要素生産性の長期推移も、19世紀後半から20世紀前半の3度の革命的上昇を経て、戦後の高原に達した。イアン・モリス(英 Ian Morris)『人類50年 文明の興亡』(2010年、米ニューヨーク)の社会発展指数も同じ形をなす ── モリスの4軸(エネルギー獲得・組織化・情報技術・戦争遂行能力)はそれぞれ最大250点で、合計1000点満点。2000年時点で西側は906点に到達しており、すでに「天井に近い高原」にある。技術・経済・社会の長期軌道は、定常的低位から階段状に高原へと押し上げられ、その高原のうえで局所的な峰がいくつも生じる、というのが妥当な定性的記述である。
本書ではこの構造を、ミラツクの詳細な分析結果で導入された文明転換指数の「双子峰の高原」モデルを引き継いで用いる。同指数は、カルロタ・ペレス(英 Carlota Perez)『技術革命と金融資本』(2002年、英エドワード・エルガー出版)の五大技術革命論を、シュミル的エネルギー基盤・モリス的社会発展指数・ゴードン的生産性曲線と統合して再構成した複合指標である。指数で見るかぎり、1971-1973年に始まる情報革命の前峰と、2012-2017年に始まる人工知能革命の後峰とが、ほぼ同じ高さの双子峰を形成している。前峰0.764、後峰0.768、その比は1.005倍にすぎない。これは「いま起きていることは、たかだか直前の峰の同じ高さの反復である」という、強い節度を要求する数値である。
特異性主張への留保 ── なぜ「シンギュラリティ」ではないのか
2026年現在、フィジカルAIや汎用人工知能の語り口の多くは、レイ・カーツワイル(英 Ray Kurzweil)『シンギュラリティは近い』(2005年、米バイキング社)以降の特異点主義の引力圏にある。同氏は2024年の改稿『シンギュラリティはより近づいた』で2045年の特異点到達を再宣言した。これに対し、スチュアート・ラッセル(英 Stuart Russell)『人間と互換性のあるAI』(2019年、米バイキング社)は意思決定理論側から汎用人工知能の統御問題を、ニック・ボストロム(英 Nick Bostrom)『スーパーインテリジェンス』(2014年、英オックスフォード大学出版会)は哲学側から超知能の存在論的リスクを論じている。ボストロムの「直交性命題(知能と価値は独立)」「道具的収束(あらゆる目的が自己保存・資源獲得など道具的目標へ収束)」は、フィジカルAIの身体性ゆえに、純粋情報的な人工知能以上に切迫した倫理的問題として再定式化される。これらが提示するのは、フィジカルAIが文明史の連続線上にではなく、その外側に立ちうるという視座である。
しかし、本書はこの視座を採らない。理由は2つある。第1に、長期指標で見るかぎり、現在の変動は1971年以来の情報革命と同じ高さの峰として記述される。物理的成果(電力消費・素材生産・建造物高度・移動速度の上限)のいずれも、20世紀後半のピークを上回っていない。シュミルが繰り返し強調するように、人類のエネルギー転換は5%から50%への市場占有率移行に50〜75年を要し、これは過去250年の鉄則である。蒸気機関は60年(1840-1900)、内燃機関は50-80年(1915-1965)、電気駆動は75-100年(2020年現在も移行中)。フィジカルAIも例外にはならない。第2に、「特異点」を主張する論者の多くが、技術曲線の指数性のみを根拠とし、社会・制度・物理基盤の同時並行進化の遅延を軽視している。ダロン・アセモグル(英 Daron Acemoglu)とサイモン・ジョンソン(英 Simon Johnson)『権力と進歩』(2023年、米パブリックアフェアーズ)が指摘するように、技術導入と生産性反映のあいだには平均20〜40年の遅延がある。電動モーターは1880年代に発明されたが、工場の生産性に反映されるのは1920年代である。同様の遅延が、現在の人工知能とフィジカルAI導入と社会成果のあいだにも横たわる。
もちろん、双子峰モデル自体は仮説である。後峰がさらに伸びて第3峰に到達するか、高原を抜け出して新しい台地に上がる可能性は否定できない。だが、現時点で利用可能なエネルギー・物質・社会指標の総合から判断するかぎり、2026年は「第2峰の登りはじめ」として位置づけるのが最も穏当である。ジョエル・モキイア(英 Joel Mokyr)『アテナの贈り物』(2002年、米プリンストン大学出版会)が用いる「有用知識」の枠組(Ω=命題的知識・Λ=処方的知識)でいえば、フィジカルAIはΩとΛの境界そのものを再編する潜在力をもつ。だが、その潜在力の発現にはシュミル的エネルギー転換の時定数(50〜75年)とアセモグル的制度遅延(20〜40年)が同時に積み重なる。本書のロードマップ全体は、この穏当な視座のうえに構築される。
フィジカルAIの定義 ── 知性が物質に降りる場所
本書で用いるフィジカルAIの定義を確定しておく。フィジカルAIとは、計算機の内側で完結する知性ではなく、(1)身体を持ち、(2)物理空間で動き、(3)生命と協働し、(4)物質を作り直す知性のことである。エヌビディア社のジェンスン・フアン(英 Jensen Huang)が2024年の家電見本市および同社のGTC基調講演で提示した同名の概念は、この四要素のうち主に(1)と(2)に重点を置く。本書はそれをさらに広げ、(3)生命系製造と(4)新素材設計までを含めて フィジカルAI と呼ぶ。これは、細胞由来ロボットや自律実験室のような、伝統的にはロボティクスとは別領域とみなされてきた取り組みを、同一の運動の異なる断面として読むためである。
この定義のもとで、フィジカルAIは過去2、3年で急速に立ち上がってきた研究と産業の集積点を指す。グーグル系研究所による視覚言語行動モデルの基盤化、その公開実装の登場、フィギュア社・エヌビディア社・フィジカル・インテリジェンス社による商用ヒューマノイドの登場、22機種527スキル160万エピソードを統合する公開データセットの整備 ── これらが第1系統の事象である。並行して、グーグル・ディープマインドのたんぱく質構造予測モデル第3世代が生体分子相互作用予測を高精度化し、細胞由来ロボットの系統が自己組織化ロボットを臨床手前段階に押し上げ、ボストン・ダイナミクス社の人型ロボット最新型が油圧駆動から電動駆動への世代交代を完成させた。これらすべてが、フィジカルAIという1つの大きな運動の構成要素である。
後峰のなかでのフィジカルAIの位置
後峰すなわち人工知能革命の峰は、それ自体が均質ではない。便宜的に3層構造で読むと、最上層が大規模言語モデルを代表とする言語空間の知性、中間層がマルチモーダル基盤モデルおよび視覚言語行動モデルを代表とする「言語と感覚と行動を結ぶ」知性、最下層がフィジカルAIすなわち物理空間に実体を持つ知性である。2022年の対話型生成AI登場で最上層が一気に立ち上がり、2023年の最新世代言語モデルおよびマルチモーダル基盤モデルで中間層が形成され、2023〜2025年の汎用ロボット基盤モデル群で最下層が立ち上がりつつある、というのが実証的記述である。
この3層は、2つの意味で結合している。第1に、技術的依存。フィジカルAIの視覚言語行動モデルは、最上層の言語モデルの基本アーキテクチャ ── ヴァスワニ(英 Vaswani)らが2017年に発表した自己注意機構 ── と、中間層のマルチモーダル接地(オープンAI社が2021年に発表した画像-言語埋め込み)を直接の祖先とする。汎用ロボット基盤の系譜は、いずれもこの祖先群の応用として立ち上がってきた。とりわけ松尾豊(東京大学)らによる「大規模言語モデルはゼロショットの推論者である」(2022年、神経情報処理システム会議)が示した「ステップ・バイ・ステップで考えよう」のひと言で推論性能が劇的に上がる現象は、言語モデルの言語空間からフィジカルAIの行為空間への翻訳可能性を示唆する重要な経験的事実として、本書を通じて参照される。第2に、経済的依存。最上層の基盤モデルを訓練するには大規模データセンターと電力が要り、その需要が半導体・電池・エネルギー転換を駆動する。オープンAI社の最新言語モデルの訓練電力は推定50ギガワット時、メタ社の公開モデル4,050億パラメータ版は約30ギガワット時と推計されている。フィジカルAIはこの駆動の物理的受益者であると同時に、ヒューマノイド稼働時間・実機データ収集・現場展開を通じてその物質的限界を露呈する側でもある。後峰のなかでフィジカルAIは、純粋な情報空間の知性が物質と接触する境界面として機能している。
前峰との比較から見える後峰の固有性
双子峰の高さが等しいことは、両者の中身が同じであることを意味しない。前峰すなわち1971〜2010年代の情報革命は、データ・計算・通信の3領域で人類の活動形態を再編した。インテル社の集積回路初号機(1971年)に始まる半導体産業 ── 1つの集積回路に載るトランジスタ数は1971年の2,300個から2022年の最新プロセッサ級1.14×10¹¹個まで51年で約5,0000倍に拡大した。基本的な通信プロトコル(1974年)からワールドワイドウェブ(1990年)に至るネットワーク化、検索エンジン(1998年)からスマートフォン(2007年)に至る端末化が、いずれも物理世界の組み換えというより、情報接続の組み換えを担ってきた。インターネット利用者は1990年の3000人から2023年の53億5,0000人へ1,780倍、スマートフォン利用者は2007年の1,0000人から2024年の490人へ490倍。1人の人間が1日に生産・消費する情報の量は、1971年と2010年代で数桁の差がある。だが、その人間が住む建物、移動する車、食べる食物、着る衣服の質感は、おおむね前峰のあいだに保たれた。情報革命は、物質の輪郭の手前で止まる革命であった。
これに対し後峰すなわち人工知能革命は、当初の数年(2017〜2022年の自己注意機構から対話型生成AIまでの期間)は前峰と同じく情報接続の延長線にあった。大規模言語モデルは文章を扱う技術であり、物質には触れない。しかし2023年以降の視覚言語行動モデル、ヒューマノイドの商用配備、自律実験室、細胞由来ロボットが同時に立ち上がったことで、後峰は前峰とは異なる方向へ伸びはじめている。すなわち、情報接続の組み換えから、物質の組み換えへ、である。これがフィジカルAIの固有性である。同じ高さの双子峰でありながら、後峰は前峰と質的に違う対象に触れる。74年の含意の大きさは、ここに依存する。
もう1つの違いは、駆動のされ方である。前峰の駆動力は主として民間企業の競争であった。検索・通販・端末を握ったプラットフォーム企業群が、利用者獲得競争のなかで指数曲線を引き上げてきた。後峰の駆動力はこれに加えて、国家・軍事・科学研究の3領域が前面に出てきている。米中の半導体規制、450億ドル規模のデータセンター構想、グーグル・ディープマインド系のたんぱく質予測・数学定理証明の科学AI、フィジカル・インテリジェンス社やフィギュア社への巨額投資 ── これらが前峰ではみられなかった規模で動いている。経済協力開発機構(英略 OECD)の公開する研究開発統計によれば、2020年時点で米国は666億ドル、中国は918億ドル、ドイツは215億ドル、日本は142億ドル、韓国は112億ドルの政府研究開発支出を計上する。中国が米国を超え、日本・韓国・ドイツがそれを追う構図が、すでに完成している。後峰は単一の市場原理では駆動されない。それは、技術・経済・地政学の三要素が結合した、より複合的な運動である。
非西洋系譜から読み直す ── フワーリズミー、本居宣長、湯川秀樹
双子峰モデルが描く250年史は、暗黙のうちに西洋史を中心とする。だが、人類が積み上げてきた知の生成史を地理的に広く取り直せば、フィジカルAIの前史はずっと深く、地理的にも広い。算法(アルゴリズム)の語源は西暦820年、バグダードのフワーリズミー(英 Al-Khwārizmī, 780-850)が著した『約分と消約の計算の書』にある。フワーリズミーの方法は、インド数学を受容しつつ体系化した手続的知識(処方的知識)であり、モキイアの言うΛ(処方的知識)の最古層に位置する。フィジカルAIが「言語によって行為を指示する」視覚言語行動モデルの技術系譜は、9世紀バグダードの手続言語に最初の鍵を持つ。
17世紀の宋応星『天工開物』(1637年、中国)は、農業・工業・冶金・染織・武器製造の130種の技術を図解で記録した百科全書である。これは「東アジア製造知の決定的書物」であり、明治維新後の西洋知識輸入(1868年)、帝国大学体制(1886年)、戦後のトヨタ生産方式(1975年頃)という東アジア内系譜のなかに置き直して読む必要がある。フィジカルAIの製造業ロボティクスの応用が、なぜ日本・中国・韓国・台湾でとりわけ急速に普及するかを問うとき、この東アジア製造知の長い前史を抜きには語れない。
本居宣長(1730-1801)の『古事記伝』が拓いた国学は、西田幾多郎と京都学派(1911年以降)へと受け継がれる系譜をもつ。西田の「純粋経験」「場所の論理」「行為的直観」は、フィジカルAIが直面する「身体性と知性の結合」の問題に対して、ハイデガー、メルロ=ポンティ、ヴァレラとは別の系譜から答えを準備している。本書の最終章(譜面を書く者と、譜面を奏でる物質)は、この西田と京都学派の哲学に明示的に触れる。1949年、湯川秀樹が日本初のノーベル物理学賞を受賞したのと同じ年、ノーバート・ウィーナー(英 Norbert Wiener)が『サイバネティクス ── 動物と機械における制御と通信』第2版(1948年初版、米マサチューセッツ工科大学出版会)を準備していた。湯川が「中間子」を予言したとき(1935年)、彼の理論は西洋物理学の最前線と東アジア知識生産の交差点に立っていた。フィジカルAIの理論的基盤も、同様の交差点で形成されつつある。
南米からも見過ごせない声がある。チリの神経生物学者フランシスコ・ヴァレラ(英 Francisco Varela, 1946-2001)はエヴァン・トンプソンおよびエレナ・ロッシュと共著『身体化された心』(1991年、米マサチューセッツ工科大学出版会)でエナクティヴィズム(行為遂行主義)を提唱した。ヴァレラの「身体化された認知」は、ロドニー・ブルックス(英 Rodney Brooks)の包摂アーキテクチャ(1986年)と並んで、フィジカルAIの設計哲学の直接的先行理論である。アンデス先住民の世界観と仏教哲学の影響を併せ持つヴァレラの理論は、フィジカルAIの「関係論的存在」(前掲図 D5-1 の第3定義)の最も精緻な祖型である。本章のつぎの章で扱う8系統への拡張のなかでも、認知系の中核として再登場する。
冷静と真剣の両立 ── 本書を貫く判断の作法
双子峰モデルが要求するのは、2つの態度の同時保持である。一方で、現在起きていることが過去250年の高原の構造的反復であるという冷静。他方で、その反復が74年で約60〜80億の人類の暮らしを物理面から組み換えうるという真剣。どちらか一方に振れると、判断は歪む。「いまさら騒ぐほどのものではない」という冷笑も、「歴史上類のない特異点だ」という熱狂も、同じく現実を取り逃がす。
本書はこの両立を、74年の精緻な時間軸と8系統合流の構造的な分解とで担保する。第1期(2026-2030)から第7期(2090-2100)までの7フェーズロードマップは、各時期に何が起き、何が起きないかを学術的根拠に基づいて限定する。基盤モデル系統から物質基盤系統までの8系統分解は、フィジカルAIを「一塊の特異な技術」として神秘化するかわりに、独立に進化する諸系譜の合流体として記述する。前者は時間の節度であり、後者は構造の節度である。両者の交差点に、フィジカルAIの実像が浮かぶ。
本書は技術論であると同時に判断の書である。74年は、現在25歳の人間が99歳になる時間幅に等しい。1人の人生のなかで完結する時間である。その時間幅で、フィジカルAIが何を作り、何を組み換え、何を生み出すかを冷静に見定めることは、その人生の輪郭を描くことと等価である。冷静さは熱情を排除しない。むしろ、熱情をささえる長い視野の確保である。
5系統合流の系譜と現在地
知性は単一の場所に存在しない。それは、生体と環境のあいだに、行為のなかで立ち上がる。
— フランシスコ・ヴァレラ、エヴァン・トンプソン、エレナ・ロッシュ『身体化された心』(1991年、米マサチューセッツ工科大学出版会)フィジカルAIは、過去2、3年で突然立ち上がった技術ではない。それは独立に発生した5つの系統が、2010年代後半から急速に合流して形成された運動である。本章では、その5系統 ── ロボット工学・ハードウェア系(1950年代起源)、古典制御・動作計画系(1960年代起源)、機械学習・強化学習系(1989年起源)、基盤モデル・視覚言語モデルおよび視覚言語行動モデル系(2017年起源)、シミュレーションとデータ生成系(1996年起源)── の系譜と現在地を順に確認する。各系統がたどってきた長い時間と、それらが2023〜2026年にどこで交差しているのかを見ることで、現在の地点の構造的厚みが見えてくる。
第1系統 ── ロボット工学・ハードウェア(1950年代以降)
系統の出発点は、ジョージ・デヴォル(英 George Devol)とジョセフ・エンゲルバーガー(英 Joseph Engelberger)が1956年に創業したユニメーション社、そして1961年にゼネラルモーターズのニュージャージー工場に納入された世界初の産業用ロボット、同社製の汎用機械腕初号機である。同機は油圧の作動装置と磁気ドラム記憶装置でダイカスト鋳物の取り出しを反復した。学術側では、1969年に米スタンフォード大学人工知能研究所のヴィクトル・シャインマン(英 Victor Scheinman)が開発したスタンフォード・アーム、同年に米国スタンフォード研究所の動く知能ロボット、1973年に早稲田大学加藤一郎研究室が完成させたWABOT-1、1978年にユニメーション社が発表した汎用組立用機械(PUMA)が並ぶ。加藤一郎のWABOT-1は世界初の本格的なヒューマノイドロボットであり、視覚・聴覚・触覚・人工筋骨格・対話機能を統合した点で、現在のヒューマノイドの原型を1973年の時点で示していた。これは本章のあと半世紀にわたる日本ヒューマノイド系譜(アシモ、HRPシリーズ、Kengoro、Atom型)の出発点である。日本では1972年の川崎重工によるユニメート機のライセンス生産が、世界最大のロボット産業基盤を生んだ。「東アジア製造知」として整理しうる宋応星から明治維新、帝国大学、トヨタ生産方式へと続く長い系譜は、まさにこの川崎・ユニメート導入の土台を準備していた。
1980年代以降は、作動装置と身体構造の革新が続く。1995年のギル・プラット(英 Gill Pratt)の弾性直列式作動装置は、剛体駆動から柔軟駆動への転換点となり、力制御精度を1〜2桁改善した。1986年に起動したホンダの2足歩行研究シリーズは2000年にアシモとして結実し、日本の人型ロボット研究の象徴となる。ボストン・ダイナミクス社は2005年の4足ロボット(米国防高等研究計画局資金)、2013年の人型ロボット(油圧版)、そして2024年の同最新版(完全電動化)と進み、油圧から電動への世代交代を完成させた。一方、産業技術総合研究所の金子健二・梶田秀司らによるヒューマノイド研究プラットフォーム(2002年)から建設現場用ヒューマノイド(2018年)への進化は、独自路線を切り開いた。東京大学情報理工学系研究科 知能機械情報学専攻の稲葉雅幸研究室では、Kengoro、Kaimanといった腱駆動の筋骨格ヒューマノイドが開発された。これらは「人間の身体構造をそのまま模倣する」という構想に基づき、ボストン・ダイナミクス社やフィギュア社が採るモーター駆動関節型とは別の道を切り開いた。2024〜2026年のヒューマノイド市場は、フィギュア、ワンエックス、テスラ、アプトロニク、ユニツリー、シャオペン、アジリティ、サンクチュアリなど20種以上の汎用プラットフォームが並立する状態にある。投資銀行各社の2024年予測では2030年累計100〜2000台、価格2〜5万ドル、連続稼働4〜8時間が中央値である。
第2系統 ── 古典制御・動作計画(1960年代以降)
ロボット工学の運動学的・動力学的基礎は、1955年のドナベンとハーテンバーグによる座標表記法、1965年のドナルド・パイパー(英 Donald Pieper)による逆運動学解法、1969年のダニエル・ホイットニー(英 Daniel Whitney)による分解運動速度制御で確立された。1980年代にはラグランジュ/ニュートン=オイラー動力学、1983年のロイ・フェザーストン(英 Roy Featherstone)による多体動力学高速計算、1985年の計算トルク制御が体系化される。1986年のロドニー・ブルックス(英 Rodney Brooks)の包摂アーキテクチャ(米国電気電子学会ロボット工学誌 第2巻第1号 14ページ)は、世界モデル不要・反射的階層制御の積層で昆虫的知能を実現する設計を提案し、古典的記号AIへの最初の体系的反論となった。日本側では、川人光男(国際電気通信基礎技術研究所)が1990年代から進めた「計算論的運動制御」が、運動制御を計算理論として記述するための枠組を提供した。川人の「内部モデル仮説」(順方向モデルと逆方向モデルの併用)は、現在の世界モデル型強化学習と直接的に接続される。
2010年代に入ると、脚式ロボット向けの凸最適化型予測制御(2018年の代表論文)に代表される予測制御が、4足・2足ロボットの動的制御の標準となる。2026年現在、産業標準は「予測制御+強化学習」のハイブリッドの2層構造である。低レベルの姿勢・接触制御を凸最適化型予測制御が担い、高レベルの歩行・操作を学習方策(拡散方策、行動連鎖型、視覚言語行動モデル)が担う。ボストン・ダイナミクス社の人型ロボット、フィギュア社の汎用基盤、エヌビディア社の汎用基盤がすべてこの共通スタックに収束した。古典制御が消えたわけではない。むしろ、学習ベースの上位層が成立したことで、古典制御は下位層として剛性を高めた。サイバー・フィジカル・システム領域の研究蓄積は、このハイブリッド・スタックの設計と検証を支えている。フィジカルAIの身体下位層は、すでに「実装から実用」の境界を超えている。
第3系統 ── 機械学習・強化学習(1989年以降)
この系統の臨界点は2013年の深層強化学習(米ディープマインド社のチームによる、アタリ社のゲームを画像入力から学習する研究)であった。深層ニューラルネットと強化学習が結合し、ゲーム画面を入力から学習できることが実証された。続く2015年の信頼領域方策最適化、2017年の近接方策最適化、2018年のソフト・アクター・クリティック法が連続制御に拡張された。2018年のオープンAI社による器用な手の操作研究は、シミュレーション学習のロボットハンドが実機で巧緻操作を行う最初の実証となり、領域無作為化(2017年)が模擬から実機への壁を部分的に解いた。日本側では、ソニーAIの自動車レーシング強化学習研究(2022年、英国ネイチャー誌 第602巻 223ページ)が、深層強化学習でレーシングゲーム世界トッププレイヤーを倒した最初の事例として記録される。木村元・河本献太らのチームが英国ネイチャー誌に発表したこの研究は、強化学習を「実時間下のスポーツ的判断」に応用する道を開いた。
2019年の4足ロボット模擬から実機への移行研究(同年、米国サイエンス・ロボティクス誌)は、4足ロボットで模擬から実機への移行が実機で動くことを示した。2021年の高速モーター適応、米マサチューセッツ工科大学のミニ・チーター強化学習研究が続き、凸最適化型予測制御と深層強化学習のハイブリッドが脚式移動の標準となる。2023年の拡散方策論文は拡散モデルを行動生成に転用、両手協調プラットフォーム(同年)が低コスト両手協調プラットフォームを実証し、22機種527スキル160万エピソードを統合する公開データセット(同年)が「ロボティクス版の標準画像データセット」を生んだ。拡散方策の開発にはトヨタ・リサーチ・インスティテュート(米マサチューセッツ州とカリフォルニア州、2015年設立)が深く関与しており、両手協調マニピュレーションの標準アーキテクチャを示した。これはサカナAI、プリファード・ネットワークス、オムロン・サイニックス と並ぶ「日本資本×北米AI研究所」のコラボレーション・モデルの代表例である。
第4系統 ── 基盤モデル・視覚言語モデルと視覚言語行動モデル(2017年以降)
最も若いが、現在の合流の主役である。2017年にヴァスワニ(英 Vaswani)らが発表した自己注意機構のみで系列変換を実現する基本構造が、その後の大規模言語モデル(米国製の代表シリーズ、米メタ社・米グーグル社の基盤)の系譜を生んだ。2021年にオープンAI社が発表した画像・言語埋め込みの統一モデルがゼロショット転移を実現、その派生(同年のクリップポート)がそれをマニピュレーションに転移した。自己注意機構以降の系譜は、その後の基盤モデル群の祖型として整理されている。
ロボティクスへの本格流入は、2022年4月の「言うこと・できること」研究(米グーグル・ディープマインド系)に始まる。大規模言語モデルでサブゴール分解、可用性スコアで実行可能性を評価する枠組みが提示された。同年末の汎用ロボット基盤初号機、2023年のマルチモーダル基盤モデル化、同基盤の続編で、視覚・言語・行動を単一の自己注意機構で結ぶ「ロボット用基盤モデル」が成立した。2024年の公開実装初号、別の総合基盤モデル、フィジカル・インテリジェンス社の同社基盤、エヌビディア社の汎用基盤、2025年のフィギュア社の自社基盤、後続バージョン群で、「単一モデルが複数機種で複数タスクを実行する」段階が確立した。汎用人工知能能力マイルストーンとして整理されてきた「マニピュレーション汎化」(2023年)はこの転換点を記録している。
日本側の基盤モデル系譜では、松尾豊(東京大学松尾研究室)が2022年に提示したゼロショット連鎖思考研究(神経情報処理システム会議)が決定的な貢献として記憶される。これは大規模言語モデルの推論の本質を「適切な指示文の言語化」として位置づけ、フィジカルAIにおける言語から行為への翻訳の概念的基礎となった。プリファード・ネットワークスの岡野原大輔と西川徹は深層学習用フレームワーク(2015年)に始まり、同社ロボット基盤、日本語基盤モデルを開発、現場ロボットと大規模言語モデルを結合する独自路線を切り開いている。サカナAIのデイビッド・ハ(英 David Ha、元グーグル・ブレイン東京、現サカナAI最高技術責任者)は「世界モデル」研究(2018年)で世界モデル型アーキテクチャを提唱した。同氏の2024年の進化的モデル統合研究は、進化計算で基盤モデルを統合する独自手法を示した。
第5系統 ── シミュレーションとデータ生成(1996年以降)
1996年のウェボッツとオープン動力学エンジンに始まり、2002年のガゼボ、2010年のV-REP(後のコッペリアシム)、2014年のトヨタ・リサーチ・インスティテュート発のドレイクが順次登場した。2015年のムジョコ(トドロフらが開発、後にディープマインドが買収・2023年オープン化)、2020年のエヌビディア社のアイザック・シム/アイザック・ラボ(オムニバースおよびオープンUSD基盤)、2024年のジェネシス(マルチフィジクス統合)が現在の標準となる。同時に、生成的世界モデルとして、ハ-シュミットフーバー2018年の世界モデル研究、ドリーマー第3世代(2024年、英国ネイチャー誌 第626巻 982ページ)、オープンAI社の動画生成モデル(2024年)、ディープマインドの動画ゲーム生成モデル第2世代(2024年)、エヌビディア社の物理世界基盤モデル(2025年)が立ち上がり、訓練データそのものを生成する経路が開かれた。世界モデル研究の提唱者であるデイビッド・ハは現在サカナAIの最高技術責任者であり、日本拠点の基盤モデル研究のキーパーソンとなっている。
2023年の22機種統合データセットと2024年の遠隔操縦データセット(564シーン・8万6,000デモ・13機関連携)は、実機データとシミュレーションデータの両輪を整えた。「データ希少性」というフィジカルAIの構造的ボトルネックへの組織的回答が、フリート学習・遠隔操縦・自律収集・合成データ生成の四方向で進展している。同領域の研究蓄積は、実機展開と研究現場の双方で参照される基盤資料となりつつある。
5系統の合流点 ── 5つの閾値超え
5系統がどこで具体的に交差したかは、5つの閾値超えとして記述できる。第1の閾値は知覚の身体化(2015〜2018年)であり、視覚的同時位置推定地図作成(V-SLAM)の系統で深層学習が処理パイプラインに本格混入した(2021年の代表研究)。第2の閾値は強化学習の実機化(2018〜2020年)であり、オープンAI社の器用な手、4足ロボット模擬から実機への移行、米マサチューセッツ工科大学のミニ・チーター強化学習が模擬から実機への移行の最初の実証群となった。
第3の閾値は言語条件付け(2022年)であり、「言うこと・できること」研究と汎用ロボット基盤初号機で「自然言語で命じればロボットが実行する」が研究室レベルで成立した。第4の閾値は視覚言語行動モデル化(2023〜2025年)であり、複数の汎用基盤モデルが「汎用視覚言語モデルをロボット出力に微調整する」アプローチを確立した。第5の閾値は大規模実機データ収集(2023〜2026年)であり、22機種統合データセットと遠隔操縦データセットが「データ希少性」というボトルネックへの組織的回答を提示した。これら5つの閾値超えが、5系統を結びつける接続点として並んでいる。
2026年の合流地点で見えるもの
5系統合流の現在地は、整理すると次の3つの像として読める。第1に、機械の身体(ハードウェアと制御)はほぼ成熟域にある。作動装置・感覚装置・低位制御の組み合わせで「動く身体」を作る課題は、コスト・稼働時間・耐久性の漸進改善を残すのみで、構造的な未解決問題はない。第2に、知能の中核(学習と基盤モデルと模擬)は急成長期にあり、まだ標準化が確定していない。視覚言語行動モデルの1,000億パラメータ標準化、推論時計算の拡張、世界モデルの物理整合性などが、第1期(2026〜2030年)の中心課題として残る。第3に、両者をつなぐ「身体と知能の翻訳」が、現在の主戦場である。同モデルは言語と視覚から行動への翻訳器であり、それを高速化・汎化・低エネルギー化することが、2026〜2030年の技術的アジェンダの中核となる。
合流の比喩を、5本の川がひとつの河口に注ぐ図として読んでもよい。それぞれの川は、上流に独自の地形と歴史を持つ。ウィーナーのフィードバック制御、デヴォルの産業ロボット、サットンとバルトの強化学習、ヴァスワニの自己注意機構、トドロフのムジョコ ── これらの源流のうち1つでも欠けていたなら、現在の河口は存在しない。フィジカルAIはこれら5本の合流の上にしか立ち上がりえなかった。そして合流したいま、それぞれの上流が依然として独立に流れつづけていることも忘れてはならない。古典制御の理論的精緻化は、同モデルの登場後もなお進んでいる。専門家混合型大規模言語モデルの拡張は、ロボティクス領域とは別の速度で展開している。合流とは融解ではなく、複数の流れが重ね描きされる場のことである。
8系統への拡張
身体は、認知が立ち上がる場である。知性を理解することは、身体を理解することに等しい。
— ロルフ・ファイファー、ジョシュ・ボンガード『身体は、いかにして思考のかたちを決めるのか』(2007年、米マサチューセッツ工科大学出版会)前章で記述した5系統合流モデルは、2026年時点のフィジカルAIを読むための最小限の枠組みである。しかし、2030〜2100年の長い時間軸で運動を追跡するには、この5系統では足りない。5系統の精緻化を進めるなかで、横断的に伏在していた3つの系統が独立化されるべきだという結論が浮上した。バイオ・神経模倣・生命系製造系(1943年起源)、マテリアル・エネルギー系(1947年起源)、認知科学・脳科学・身体性認知系(1948年起源)の3つである。本章では、なぜこれら3系統を独立化する必要があるのか、そしてそれによってフィジカルAIの全体像がどう変わるのかを記述する。
第6系統 ── バイオ・神経模倣・生命系製造(1943年以降)
この系統は3層からなる。第1層は神経模倣ハードウェアであり、起点はマカロックとピッツによる形式ニューロン(1943年、米国数理生物物理学紀要 第5巻 115ページ)にある。ローゼンブラットの単純パーセプトロン(1958年)、ヘッブ学習則(1949年)から液体状態機械(マース・ナチュシュレーガー・マルクラム 2002年、米国誌『神経計算』第14巻 2531ページ)、米国アイビーエム社の神経模倣チップ(メロラら 2014年、米国サイエンス誌 第345巻 668ページ)、米国インテル社の同社第2世代(2021年、114万ニューロン×128コア)、米国アイビーエム社の同社新型(2023年、サイエンス誌)と進む。事象駆動型カメラ(リヒトシュタイナーら 2008年、米国電気電子学会誌)は網膜の非同期スパイク発火を模した視覚センサで、プロフェシー社・イニビジョン社が量産化している。神経模倣領域の研究蓄積は、低消費電力推論がエッジ人工知能と統合される潮流を示している。日本側では、東京大学の合原一幸(複雑系・カオス理論)の研究グループが液体状態機械の解析に長く貢献し、また富士通・ソニーセミコンダクタが画像センサ融合型の神経模倣チップ開発を進めている。
第2層は身体模倣(バイオミミクリー)であり、マッキベン式空気圧人工筋肉(1957年)に始まる。ハーバード大学のホワイトサイズ研究室によるソフトロボティクス(2008年)、化学駆動の完全自立軟体ロボット(2016年、英国ネイチャー誌 第536巻 451ページ)、超小型飛翔ロボット(2013年、米国サイエンス誌 第340巻 603ページ)、折り紙ロボット(2014年、サイエンス誌)と連なる。米国スタンフォード大学の深海ロボット(2022年、米国サイエンス・ロボティクス誌 第7巻第65号)は深海200mで触覚フィードバック付き操作を実証した。日本側では、東京工業大学(現 東京科学大学)の鈴森康一(人工筋肉・空気圧作動装置)と岡山大学の松野隆幸(ヘビ型ロボット)が、独自路線のソフトロボティクスを切り開いている。国吉康夫(東京大学情報理工学系研究科 知能機械情報学専攻)の「認知発達ロボティクス」は、身体性が知能の発達を導く理論を実機で検証する世界的拠点であり、ファイファーとボンガードの理論的継承を実装側で担っている。
第3層が現在進行形で立ち上がっている生命系製造であり、アドルマンによる遺伝子計算(1994年、米国サイエンス誌 第266巻 1021ページ)、ロザムンドの遺伝子折り紙(2006年、英国ネイチャー誌 第440巻 297ページ)を遠い起源としつつ、決定的事象は細胞由来ロボット研究(クリーグマン、ブラックストン、レヴィン、ボンガード 2020年、米国科学アカデミー紀要 第117巻第4号 1853ページ)である。アフリカツメガエル細胞から自己組織化するロボットが報告され、2021年には自己複製版(同紀要 第118巻第49号)、2023年には成人肺細胞由来の同類研究(グムスカヤら 2023年、独国学術誌『先端科学』第10巻第34号)が続いた。並行して自律実験化学ロボットが立ち上がる。リバプール大学の移動型化学者ロボット(バーガーら 2020年、ネイチャー誌 第583巻 237ページ)、米国カリフォルニア大学バークレー校・ローレンスバークレー国立研究所の自律実験室(シマンスキら 2023年、ネイチャー誌 第624巻 86ページ ── 17日間で41の新規無機材料を合成)、最新言語モデルで化学合成を制御する研究(ボイコら 2023年、ネイチャー誌 第624巻 570ページ)。人工知能設計薬では、英国アイソモーフィック・ラボ社(ディープマインド系)がたんぱく質構造予測モデル第3世代(アブラムソンら 2024年、ネイチャー誌 第630巻 493ページ)を基盤に動き、米国インシリコ・メディシン社の新規医薬品候補が2024年に第II相試験到達(英国学術誌『ネイチャー・バイオテクノロジー』第42巻 1099ページ)となった。
この3層を束ねる必要がある理由は明確である。生命と機械の境界が、物質的に再定義されつつあるからである。ソフトロボティクス、神経模倣チップ、細胞由来ロボット、植物と人工知能の協働は、5系統の単純な拡張ではなく、機械の身体素材を生体組織へ、計算アーキテクチャを神経模倣へ、製造プロセスを生命系へと同時に注入する1つの運動の異なる断面である。ミラツクの詳細な分析結果の中核予測である2070年「生命系製造期」は、この系統の合流到達点として位置づけられる。
第7系統 ── マテリアル・エネルギー(1947年以降)
この系統は、フィジカルAIを支える物質基盤と、フィジカルAIによって加速される対象の両方を兼ねる二重性を持つ。1947年米国ベル研究所の点接触型トランジスタ(バーディーン・ブラッタン・ショックレー)に始まる半導体史、1859年フランスのプランテによる鉛蓄電池から1991年ソニーの円筒形リチウム電池を経て2024年の270〜300ワット時毎キログラム級正極材に至る電池史、1976年の1ワットあたり106ドルから2024年の1ワットあたり0.10〜0.13ドルへと約1,000倍下落した結晶シリコン太陽光モジュールのスワンソン曲線、1982年のファインマンの量子計算講演から2024年米国グーグル社の表面符号誤り訂正しきい値突破(英国ネイチャー誌 第638巻 920ページ)に至る量子計算史。この4つの柱が並列して進む。長期の指標蓄積は、これら4つの曲線を統合的に追跡している。
フィジカルAI文脈での決定的事象は、2023年の英国ディープマインドの結晶構造生成モデル(マーチャントら、ネイチャー誌 第624巻 80ページ ── 2200件の新規結晶構造候補生成、うち380件が密度汎関数理論的に安定)と、それと連動した米国の自律実験室(前掲シマンスキら 2023年、ネイチャー誌 第624巻 86ページ ── 17日間で41種を合成成功)である。これによって従来5〜10年かかった新材料発見が数週間から数ヶ月に短縮する基盤が整った。同時期、トヨタが2023年6月に2027〜2028年の全固体電池搭載車の商用化(航続1,200km・充電10分以下)を公式宣言、サムスンSDIが2024年にS-Line全固体パイロットライン稼働、メルセデス・ベンツとステランティスにサンプル出荷を開始した。固体電池はヒューマノイドの稼働時間を4〜8時間から16〜24時間に質的に転換する律速要因である。日本側では、東京工業大学の菅野了次(リチウムイオン超イオン伝導体)と、東京理科大学・京都大学・大阪府立大学の電池研究センター群が、トヨタ・パナソニック・GSユアサと連携する全固体電池開発の中核を形成している。長期コスト分析(230年・15領域・158手法)は、電池コスト1991年の1キロワット時あたり7,500ドルから2023年の同139ドルへの54倍低下を、ライト経験曲線として記録する。
エネルギー側では、小型モジュール炉と核融合が二正面で進む。米国ニュースケール社、米国ゼネラル・エレクトリック日立ニュークリア社の300メガワット級沸騰水型(オンタリオ州2029年稼働予定)、米国テラパワー社の高速炉(ワイオミング州2030年稼働予定)、英国ロールス・ロイス社の小型モジュール炉。核融合では米国コモンウェルス・フュージョン社(2026〜2027年稼働予定)、米国ヘリオン・エネルギー社(米国マイクロソフト社と2028年から50メガワットの電力購入契約)、米国TAEテクノロジーズ社、国際熱核融合実験炉ITER(2025〜2026年初プラズマ予定)。データセンター電力需要は国際エネルギー機関の2024年推計で2022年の460テラワット時から2026年最大1,050テラワット時へ倍増。米国のペンシルベニア・ニュージャージー・メリーランド連系の系統では2024年に容量市場価格が前年比9倍に高騰し、データセンター需要が直接の原因として指摘された。マイクロソフト社のスリーマイル島1号機再稼働契約(2024年9月、コンステレーション・エナジー社と20年の電力購入契約)は、人工知能と原子力の構造的合流を象徴する。日本でも、東芝・三菱重工・日立が小型モジュール炉技術を保持し、量子科学技術研究開発機構で大型超伝導トカマク核融合実験装置が2023年に運転開始した。
この系統を独立化する根拠は、人工知能とエネルギーの相互依存にある。最新世代の大規模言語モデルの訓練電力は、上位モデルで推定50ギガワット時、4,050億パラメータの公開モデルで約30ギガワット時と試算される。1台のヒューマノイドが24時間稼働するとき、本体電池消費(数キロワット時)よりクラウド推論コスト(数十キロワット時換算)の方が大きくなる可能性がある。フィジカルAIの軌道は、物質基盤の進捗に物理的に律速される。物質基盤を独立系統として扱わない限り、楽観過剰または悲観過剰のどちらかに振れる。
第8系統 ── 認知科学・脳科学・身体性認知(1948年以降)
この系統は、フィジカルAIの「内側」── 何が知性として立ち上がるのか ── を規定する。第1波は1943年のマカロックとピッツから1948年のウィーナーのサイバネティクス(米マサチューセッツ工科大学出版会)へ。1956年のダートマス会議が人工知能を「記号操作」と再定義し、サイバネティクスの身体性的視座から離反した。1969年のミンスキーとパパートの『パーセプトロンの原理』が単純パーセプトロンの表現限界を示し、ニューラルネットと身体性の研究は1970年代に主流から退いた。
第2波は1980〜1990年代の身体化認知である。レイコフとジョンソン『レトリックと人生』(1980年)、同『肉体の中の哲学』(1999年)、マトゥラーナとヴァレラのオートポイエーシス論(1980年)、前掲ヴァレラとトンプソンとロッシュ『身体化された心』(1991年)で行為遂行主義が提唱された。ヴァレラがチリ出身の神経生物学者であり、彼の理論がアンデス先住民の世界観と仏教哲学の影響を併せ持つことは、第1章で確認した。フィジカルAIの設計哲学が「西洋発」と片付けられない理由は、ヴァレラ1人を取っても明らかである。ロボティクス側ではブルックスの包摂アーキテクチャ(1986年)と「表象なしの知能」(1991年、人工知能誌 第47巻 139ページ)が記号的人工知能への最も明確な反論となった。日本側では、浅田稔(大阪大学先導的学際研究機構、現名誉教授)の「認知発達ロボティクス」(浅田ら、2009年、米国電気電子学会『自律精神発達論文誌』第1巻第1号 12〜34ページ)が、身体性が知能の発達を導く理論を世界に発信した。ロボカップを共同創設したのも浅田であり、彼の貢献は人工知能研究と発達科学の架け橋として、本書を通じて繰り返し参照される。
第3波は2000〜2010年代の4つのE型認知(身体化・状況埋め込み・行為遂行・拡張)と予測符号化である。クラークとチャーマーズ「拡張された心」(1998年、英国哲学誌『アナリシス』第58巻第1号)、クラーク『心を超サイズに』(2008年)が拡張認知を体系化。カール・フリストン「自由エネルギー原理 ── 統一的脳理論か」(2010年、英国学術誌『ネイチャー・レビュー神経科学』第11巻 127ページ)が脳の働きを「自由エネルギー最小化」として統一的に説明する枠組みを提示し、能動的推論理論が立ち上がった。機械学習側では、世界モデル研究(ハとシュミットフーバー 2018年)がフリストン的予測脳の工学的実装を示し、ヤン・ルカンの共同埋め込み予測アーキテクチャ(2022年、オープンレビュー誌)が大規模言語モデル中心パラダイムへの代替を提示した。日本側では、京都大学の谷淳(理化学研究所脳科学総合研究センター)の予測符号化型再帰型神経回路網とロボット運動学習の統合研究、国際電気通信基礎技術研究所の川人光男の「計算論的運動制御」枠組が、フリストンとハ-シュミットフーバーに先行する系譜として位置づけられる。
第4波は2020年代の脳機械接続と身体性人工知能実装期である。米国ニューラリンク社は2024年1月にノーランド・アーボウ氏への1,024電極第1世代チップ移植を公開、米国シンクロン社は血管内ステント型脳機械接続を2022年から米国食品医薬品局監督下の臨床試験を開始、2025年時点で10名以上の被験者が日常生活で使用している。脳機械接続領域の研究蓄積は、実証段階(技術成熟度4〜5)と評価される。伊国技術研究所の発達ヒューマノイド研究プラットフォーム(メッタら 2010年、神経ネットワーク誌 第23巻 1125ページ)は15年以上にわたり発達ロボティクスのプラットフォームとして稼働しており、2024年版の同第3世代は遠隔操作と自律学習を統合した。ロボティクス向け能動的推論は、伊国研究評議会のペッツーロとフリストンによる代表論文(ラニロスら 2021年)に整理されている。京都大学の乾敏郎(情報学)は能動的推論の神経科学的基礎を日本に紹介する第1人者として、フリストンとペッツーロの系譜の日本側受容を担っている。
この系統を独立化する根拠は、フィジカルAIの最適化目標そのものを規定する役割にある。強化学習は与えられた報酬関数を最大化する。基盤モデルは与えられた損失関数を最小化する。これに対し、認知系は「何を最適化するべきか」「身体性とは何か」「知性が立ち上がる条件は何か」という根源的問いを扱う。フリストンの自由エネルギー原理、ヴァレラの行為遂行主義、クラークの拡張された心、ハッチンズの分散認知、西田幾多郎の「行為的直観」── これらはフィジカルAIの設計原理として、5系統の上に立つメタ層を構成する。本書では西田と京都学派、そしてヴァレラの行為遂行主義を「東西の双子」として終章で対置する。
8系統の3層構造と駆動順序
3つの新系統を加えると、フィジカルAIは8系統からなることになる。これら8系統は対等に並列するのではなく、依存関係と駆動順序を持つ。第1層は物理基盤層であり、物質系単体である。半導体・電池・エネルギー・新材料が、他の全系統の物理的可能性を規定する。第2層は実装層であり、身体・制御・模擬の3系統からなる。第3層は学習・知能層であり、強化学習・基盤モデル・生命系・認知系の4系統が並ぶ。
時間軸で見ると、8系統は次の順序で互いを駆動する。物質系 → 身体・制御(実装)→ 模擬(訓練環境)→ 強化学習・基盤モデル(知能注入)→ 生命系・認知系(関係・生命・認知)。ただしこの矢印は一方通行ではない。生命系(自律実験室と結晶構造生成モデル)は物質系に対して新材料発見の正のフィードバックを返す。認知系(能動的推論)は強化学習に新しい最適化目標を提供する。基盤モデル(同モデル)は身体系(ヒューマノイド)の応用範囲を再定義する。これら相互作用が、第2部で扱う7フェーズロードマップ(第1期 2026〜2030年から第7期 2090〜2100年)の推進力となる。
生命系は特殊な位置にある。ソフトロボティクスと神経模倣チップは第2層(実装)として、細胞由来ロボットと自律実験室は第3層(生命設計)として機能する。すなわち生命系は第2層と第3層の境界に位置し、両層をまたぐ。ミラツクの詳細な分析結果における関係論的存在論は、まさにこの境界が物質的に揺らぐ事態を扱う。ソフトロボティクスと細胞由来ロボットが進展するほど、機械と生命の2項対立は物質的に破綻する。生命系を独立化することは、その破綻を理論的枠組みに正面から書き込むことに等しい。
なぜいま3系統を独立化するのか
8系統への拡張は、単なる分類整理ではない。それは、フィジカルAIの定義そのものを書き換える動作である。5系統モデルでは、フィジカルAIは「身体を持つ人工知能」とほぼ同義になる。これに対し、8系統モデルでは、フィジカルAIは「物質・生命・認知が知性と統合される74年の運動」となる。前者は2025年時点のエヌビディア社のジェンスン・フアン流の定義に近く、後者は2070年「生命系製造期」を視野に入れた書籍系の定義である。本書は後者を採る。
3系統独立化の根拠は、それぞれ次の通りである。生命系については、細胞由来ロボット、その第2世代、自律実験室、たんぱく質構造予測モデル第3世代の臨界事象群が2020〜2024年に並んで起き、生命と機械の境界が物質的に動き始めた。物質系については、結晶構造生成モデルと自律実験室の正のフィードバック、固体電池量産化、核融合複数機並走、データセンター電力需要倍増という4つの事象が、人工知能とエネルギーの相互依存を構造的事実にした。認知系については、能動的推論の産業実装(2024年の代表例)、脳機械接続第I相、世界モデルのロボット標準層化が、認知科学が抽象哲学から実装規格へと移行する転換点を示した。3系統とも、2020年代前半に独立化を正当化する事象群が立ち上がっている。
3系統を独立化することの実務的含意は、第2期(2030〜2040年)以降のロードマップが質的に変わる、ということである。5系統だけで2040〜2100年を語ろうとすると、たとえば細胞由来ロボットや自律実験室の動向は「模擬系の拡張」「身体系の素材革新」として処理されてしまう。これは2070年生命系製造期や2100年知性のオーケストラを正しく描けない。8系統への拡張は、フィジカルAIの長期軌道を解像度高く読むための解析装置である。
8系統オーケストラの先取り
第2部以降で詳述する7フェーズロードマップを、ここで8系統の言葉で先取りしておく。第1期(2026〜2030年、視覚言語行動モデル基盤定着期)は、基盤モデルと身体の合流が完成期に入り、古典制御と模擬が共通スタックを固める段階である。物質系の全固体電池量産と小型モジュール炉商用初号機がここで起き、フィジカルAI普及の物理基盤が整う。生命系は神経模倣エッジ人工知能で普及層に入り、認知系は世界モデルが標準層に上がる。第2期(2030〜2040年、物理操作汎化期)で同モデルがクロスエンボディメント転移を完成、非構造環境50%タスクで人間並みに到達する。第3期(2040〜2050年、人間-機械並走期)で汎用人工知能が形式的厳密な意味で到達、認知スタックが産業標準として確立する。
第4期(2050〜2060年、自律物理エージェント期)で人工知能エージェントが組織を持ち、目標設定から実行までを一貫して自律で行う段階に入る。生命系では合成生物・人工臓器の人工知能設計が一般化、生体ハイブリッドロボットが日用品レベルで使用され、修理ではなく「再生」される製品系統が立ち上がる。第5期(2060〜2075年、知性のオーケストラ生成期)で書籍中心命題が現実化を始め、生命系の「生命系製造期」が到来する。第6期(2075〜2090年、ポスト人間中心物理エコシステム期)でフィジカルAIは「個別機械」から「分散身体」へ転換、ロボットという概念が消え、物理操作能力が環境・建物・道具・身体に分散的に埋め込まれる(環境溶解的身体化)。そして第7期(2090〜2100年、関係論的物理生態系期)で、フィジカルAIは他の人工知能形態(大規模言語モデル・生体人工知能・量子人工知能・分散人工知能)と境界が溶解した状態に到達する。
この長い軌道で見ると、8系統への拡張は、5系統モデルが扱えなかった「合流の先」を解像度高く描くための装置だとわかる。2026年の合流地点はゴールではなく出発点である。74年のロードマップの最後で待っているのは、合流の先の発散 ── 多様な知性が並列に存在する状態 ── である。8系統は、その発散を地図として持ち歩くための分節装置である。
視覚言語行動モデル基盤の定着から物理操作の汎化へ──「言葉で指示し身体で動く」道具が産業の前提条件に変わる14年間
「ロボットは、世界を理解しているのではなく、世界に対する自分の振る舞いを徐々に整えているのである。」
ロドニー・ブルックス (米 Rodney Brooks)『表象なき知能』(1991)
2026年から2040年までの14年間は、フィジカルAIの長い時間軸の中で最初に大きな「定着」と「汎化」が同時並行で起きる時期である。前章までに見てきたように、2010年代後半に注意機構を中核に据えた基盤技術が言語モデルを爆発的に成長させ、米グーグル系列のロボット基盤モデルが2022年に登場して以降、視覚と言語の事前学習を物理身体へ橋渡しする視覚言語行動モデル (英略VLA) の系譜が次々と登場した。2023年の RT-2、2023年末に22機関が連名で公開した大規模多機種データ集(22ロボット種・527スキル・16万タスクを集積)、2024年の OpenVLA、米フィジカルインテリジェンス社の π0、米エヌビディアのヒューマノイド基盤モデル、米フィギュアAI社のヒューマノイド連続制御モデル、米フィジカルインテリジェンス社のオープンワールド汎化モデルへと続く道筋は、言語モデルの能力を物理身体へと接続する道を切り拓いた。学術界の論文蓄積を辿ると、2023年以降の視覚言語行動モデル関連の累積被引用は年率3倍を超えており、2017年以降の言語モデル領域の加速曲線にほぼ重なる。フェーズAはこの「ようやく動くようになった」段階から、「業務プロセスの標準前提として組み込まれる」段階への移行期にあたる。続くフェーズBは、その標準化された道具が構造化された倉庫や工場の外へ──家庭・農地・建設現場・災害現場へ──と汎化していく時期である。本章では、この14年間の道程を、5系統合流モデル(基盤モデル・ロボティクス・古典制御・強化学習・シミュレーション)と独立化された三新系統(バイオ・マテリアル・認知)の8系統の織り合わせとして読み解く。
この14年間に最も重要な構造的変化は、フィジカルAIが「業務支援道具」として認識される段階から、人間の労働の隣に置かれる「協働相手」として認識される段階への移行が始まることである。前者は工学的な性能の問題であり、後者は社会的な関係性の問題である。両者は別物だが、本章が示すのは、技術系統の進展がその社会的位置の変化を半ば強制的に押し進めていくという、非対称な力学である。日本の研究系譜では、西川徹と岡野原大輔の率いる Preferred Networks が2025年12月に発表した自律稼働デバイス向け軽量視覚言語モデルと、ギル・プラット (米トヨタ研究所長) の戦略のもとで開発された Large Behavior Models が2025年8月に米ボストン・ダイナミクスのヒューマノイドに搭載され、移動と物体操作を含む長い連続タスクの実行に成功した事例が、フェーズAの入口における日本系研究の実質的な貢献点を示す。プラットの戦略は「視覚言語行動モデルを別系統で開発するのではなく、模倣学習と拡散方策と振る舞い複製を統合する」点に独自性がある。同じく東京大学の松尾豊と國吉康夫は、それぞれ「世界モデルと身体性」「胎児期からの身体スキーマ獲得」を理論的に主導しており、フェーズAの視覚言語行動モデル議論にとっての日本側の知的足場を形成している。
フェーズA (2026-2030) ── 視覚言語行動モデル基盤の定着期:百Bパラメータ × 1000万デモが業界共通の床になる
フェーズAの主役は、明確に基盤モデル系統である。2023年に RT-2 がインターネット規模の視覚言語事前学習と少量のロボット微調整の組み合わせを実証して以降、わずか2年で OpenVLA 七B、π0、その高速化版、Stanford 系の効率化版(標準ベンチで成功率七六.5%から九七.1%へ、行動生成スループット26倍を達成)、米エヌビディアのヒューマノイド基盤、米フィギュアAI社の連続制御モデル、米フィジカルインテリジェンス社のオープンワールド版、軽量化された450Mパラメータ版、中国科学院計算技術研究所の一ビット版(メモリ二九.8%削減)、香港科技大学の統合拡散モデル(自己回帰型比4倍高速)と展開された。これは「単一モデルが複数機種で複数タスクを実行する」段階が研究プロトタイプから業界標準へと固まる過程である。2028年頃には百Bパラメータ規模・1000万デモ訓練の視覚言語行動モデルがデファクトとなり、先述の大規模多機種データ集の発展形が事実上の業界共通基盤となる見込みである。汎用人工知能 (AGI) 研究のタイムラインを集約した予測群──デミス・ハサビス (米 Demis Hassabis) の2024年発言、市場予測プラットフォームの中央値、ヴィノド・コースラ (米 Vinod Khosla) の2030年予測──は、いずれも「狭義の汎用人工知能」の到達点をフェーズA末に位置づけており、フィジカルAIの視覚言語行動モデル標準化と汎用人工知能予測の収束点が物理的に重なる。学術界の見通しでは、視覚言語行動モデルが複数ロボット種で50%タスク汎化を達成する時期は、メインストリーム化までの残期間がおよそ二.3年と推計される。
同時に、ロボティクス系統では商用ヒューマノイドの本格配備期が始まる。配備事例を整理すると、米アジリティの Digit はすでに大手物流企業と2024年に複数年契約を結び、米アマゾンの産業革新基金からも投資を受けて配備が進む。製造拠点はオレゴン州で初期能力年10000台規模を公表した。米アプトロニクの Apollo は独メルセデス・ベンツの組立工場で実地配備に入り(2024年3月契約)、米フィギュアAI社の Figure 02 は独BMWのスパルタンバーグ工場で稼働を開始した(2024年1月契約)。Figure 03 は2025年10月に発表された量産志向モデルで、量産拠点について年12000台、4年以内に100000台規模へ拡張する計画が公表されている。米テスラの Optimus V3 は2026年量産開始の予定だが、2025年4月の報道では希土類磁石の中国輸出規制が当初の年5000台目標達成を阻む可能性が示唆された。中国ユニツリーの G1 は16,000ドルの公式価格で開発者市場を席巻し、上位機種 H1 は約9万ドル級で大型機を市販化、中国UBTECHのWalker S 系列は中国の主要自動車メーカーとの協業を相次ぎ発表した。米ゴールドマン・サックスが2024年に出したヒューマノイド市場予測では、2035年市場規模380億ドル、2030年出荷250000台超、2035年出荷1400000台規模が示されている。これらの数字は、構造化された作業──倉庫ピッキング、軽組立、パレタイズ、ホテル客室清掃──において、ヒューマノイドが人件費競合点を突破することを意味する。米ボストン・ダイナミクスが2024年4月に公表した Atlas Electric は、油圧から電動への世代交代の象徴であり、この交代がフェーズA末までに業界全体で完了する。
古典制御系統の動きは目立たないが、産業実装上は決定的に重要である。フェーズA中盤までに、低レベルのバランス・姿勢制御を2018年に発表された凸最適化ベースのモデル予測制御が担い、高レベルの歩行・物体操作を拡散方策や視覚言語行動モデルといった学習ポリシーが担う2層構造が、米ボストン・ダイナミクスのアトラス、米フィギュアAI社のヒューマノイド、米エヌビディアの基盤モデルのすべてに共通アーキテクチャとして実装されることになる。1987年に提案された全身制御の枠組みは、その内部実装が学習ベースに置き換わってもなお、ロボット制御の理論的言語として残り続ける。これは「古い理論が新しい実装で延命される」典型例として、フェーズAの構造を象徴する事象である。強化学習系統では、シミュレーションから実機への転移が本格成熟期を迎える。先述の大規模多機種データ集の後継──2024年公開の家庭・産業混成データ集、その発展形──が1000万デモ規模に到達し、視覚言語行動モデル訓練の標準基盤となる。ただし、近年公開された堅牢性ベンチマークが示したように、標準ベンチで95%級に見える視覚言語行動モデルが、視点・初期姿勢の小さな摂動で30%未満へ落ちる事例があり、物理推論能力、サンプル効率(新規タスクごとに50から300デモを要する)、長期計画(30分以上のタスク)の3つのボトルネックは、フェーズA末までに完全には解消されない。これらはフェーズBへの宿題として残される。シミュレーション系統では、米エヌビディアの統合プラットフォーム、物理エンジン基盤、新興のオープン基盤が共通基盤として定着し、世界モデルとの統合で全体成功率が50%向上する事例も登場している。生成的世界モデル(米オープンAI社の動画生成、米グーグルの相互作用シミュレータ、米エヌビディアの3系統世界モデル)が訓練データ生成器として実用化される。ただし、初期の動画生成モデルは物理整合性ベンチマークで10.0%に留まる事例もあり、視覚的リアリズムが物理理解を意味しないという制約は部分的にしか解決されない。
フェーズAのボトルネックと社会への波及──物理推論の壁と電力の壁
フェーズAで顕在化する主要なボトルネックは、4つの層に整理できる。第1に物理推論ギャップである。大規模言語モデルや視覚言語行動モデルは物理常識テストで人間に劣る。2020年の研究では、当時の最先端言語モデルの物理推論誤答率は三〇から40%に達した。これはフェーズA末まで完全には解消されない。第2にサンプル効率の問題である。新規物理タスクごとに50から300デモが必要で、人間の経験量の数1000倍から数1000000倍を要する。第3にバッテリーエネルギー密度の物理限界である。リチウムイオン電池の現行密度二七〇から300 Wh/kg ではヒューマノイド連続稼働は二から4時間が限界で、トヨタや韓国サムスンSDIが予告する全固体電池五〇〇 Wh/kg の量産化が2028から2030年に間に合わなければ、フィジカルAI普及が三から5年停滞する可能性がある。米アプトロニクの Apollo が交換式バッテリーを特徴にし、米ボストン・ダイナミクスのアトラスのような高運動性能機が稼働時間制約を抱えるのは、この物理制約が根本的だからである。手指系統も同様で、カナダの開発企業や米フィギュアAI社が訴求する把持精度は、研究室で数10回成功することと現場で数100回失敗しないことの間に大きな距離がある。
第4にデータセンター電力供給制約である。国際エネルギー機関 (英略IEA) の2024年推計では、データセンターの世界消費電力は2022年の460TWhから2026年に最大1050TWhへ倍増する。米PJM域内では2024年に容量市場価格が前年の9倍に跳ね上がった。送電網増強は八から12年の計画スパンを要するのに対し、人工知能需要は年率数10%で急成長する。この時間スケールの不整合が、フェーズA期間中の人工知能産業の最大の物理的制約である。米マイクロソフトが2024年にスリーマイル島一号機の再稼働契約を米コンステレーション社と結び、米グーグルが米カイロス・パワー社と小型モジュール炉の電力購買契約を結んだのは、この制約への構造的応答である。カナダ・米国の小型モジュール炉商用初号機の稼働は2029年前後と見込まれており、これがフェーズA末のエネルギー基盤を規定する。エネルギー3制約は次のように要約できる──2026年は電力軸が最大の制約となるが、2050年頃には3制約(計算・データ・電力)が均衡し、2075─2100年は実機データの希少性が新たな主制約として浮上する。
社会への波及としては、製造現場の構造的変化を扱う長期予測でも示されている通り、「製造現場のオーケストラ化」の最初の実装が始まる。経済協力開発機構の労働の未来ベンチマークの基準で言えば、構造化作業──倉庫ピッキング、軽組立、ホテル客室清掃、レジ業務──の労働市場が再編成される。国際労働機関の2023年作業文書は事務職タスクの高曝露24%・中曝露58%を示し、国際通貨基金の2024年スタッフ討議ノートは世界雇用の約40%が人工知能高曝露職業にあり、先進国では約60%、新興国約40%、低所得国約26%と推計した。米ゴールドマン・サックスの2023年生成人工知能推計では世界で約300000000人分のフルタイム雇用が自動化曝露に置かれる可能性が示され、米国・欧州では作業時間の約4分の一が自動化可能、世界 GDP を長期的に約7%押し上げる可能性が指摘された。ただし、ヒューマノイドが物流と製造の閉鎖空間に留まるため、一般市民との接触はフェーズAではまだ限定的で、非構造環境(家庭・野外・災害現場)には未到達である。社会受容の本格的論点はフェーズBに持ち越される。前プロジェクトの2030人材像──視覚言語行動モデル・基盤モデルを業務プロセスに組み込める運用設計者、ヒューマノイドとの分業設計を担うオペレーション・マネージャ、人工知能設計材料を製品開発に活用できる材料エンジニア──が、この時点で求められる3類型である。
フェーズAの地政学 ── 米中欧日 + 印の4極ダイヤモンド
フェーズA (2026-2030年) のフィジカルAI実装は、米中欧日の3極──実質的には米中欧日と新興のインドを加えた4極──構造で進む。米国は米エヌビディア(GPU・世界モデル)、米テスラ(ヒューマノイド・自動運転)、米ボストン・ダイナミクス(アトラス・スポット)、米フィギュアAI社、ノルウェー 1X 社などの民間先行で、政策面では米国の半導体および科学法が半導体製造補助・研究開発・労働力育成を通じて米国内の計算基盤を回復しつつある(500億ドル規模、うち390億ドルが施設・設備、110億ドルが研究開発)。軍事面では米国防総省のレプリケータ計画が2023年8月に開始され、全領域・消耗可能・自律システムを18-24か月で複数千規模配備する構想で、量産型ロボット兵器というフィジカルAIの軍事応用を先取りする。米国防高等研究計画局の高速無人地上車計画、都市環境の小型無人機群計画、自律システムへの信頼可能なニューロシンボリック学習・推論計画が共通課題を軍事予算で押し上げる。人工知能ガバナンスは2023年10月の前政権大統領令から2025年1月の現政権の撤回大統領令へと振れたが、フィジカルAIには商用化・防衛・製造の速度優先シグナルとして作用する。
中国は2015年の「中国製造2025」と2023年10月の工業情報化部「人型ロボット革新発展指導意見」で国家戦略化、中国ユニツリー・XPeng・小米・BYD・UBTECH・Fourier が大量生産で先行。指導意見は2025年までに人型ロボットのイノベーション体系を初歩的に構築し、「大脳(人工知能大規模モデル)」「小脳(運動制御)」「肢体(アクチュエータ)」で突破を得ること、2027年までに国際競争力ある産業生態を形成することを掲げた。2025年3月には工業情報化部が具身知能に関する政策文書を掲載、北京の人型ロボット革新中心の具身知能プラットフォームが「一脳多能」「一脳多機」を掲げる。米ゴールドマン・サックス推計では2030年に世界ヒューマノイド販売数の40%を中国が占める見込み。中国UBTECHは2023年12月に香港取引所メインボード上場を行い、中国ユニツリーは2024年に G1 を発表(16,000ドル)、XPENGはEV・飛行車・ヒューマノイドを一体の具身知能エコシステムとして説明し IRON を披露した。
欧州はEU人工知能法(2024年8月1日発効)の規制ベースで先行、スイス・スウェーデンのABB、独KUKA、独Festo、デンマークのユニバーサル・ロボットなど伝統的ロボティクス企業が産業ロボットからフィジカルAIへ進化する。Horizon Europe(2021-2027、総額約955億ユーロ)は2025年に「堅牢かつ信頼可能なロボティクス・産業自動化向け生成人工知能」トピック(8500万ユーロ)を出し、ドイツはシュトゥットガルトのアリーナ計画、フランスはフランス2030から約25億ユーロを人工知能に投じる。日本は経済産業省「人工知能ロボティクスの社会実装に向けた政府の方向性」(2026年3月)、ムーンショット目標1「2050年までに、人が身体、脳、空間、時間の制約から解放された社会」とムーンショット目標3「2050年までに、人工知能とロボットの共進化により、自ら学習・行動し人と共生するロボットを実現」が長期軸を提供する。韓国の人型ロボット連合(2025年4月設立、2030年までに1兆ウォン超投資、サムスンがレインボー・ロボティクスの株式35%取得)、インド電子情報技術省のロボティクス国家戦略草案(製造・農業・医療・国家安全保障4分野)+インド人工知能ミッション(1兆三七二.92億ルピー予算)、アラブ首長国連邦の研究機関と米エヌビディアによる中東初の人工知能・ロボティクス共同研究ラボ、サウジアラビアのNEOM建設ロボティクスが補完極を成す。
サプライチェーン争点は3層に整理できる。第1に人工知能計算基盤──ヒューマノイドを大量に学習・シミュレーションするにはGPUクラスタ・ロボットデータ・シミュレータが必要で、米エヌビディアエコシステムと中国の国産人工知能チップ政策が競合する。第2にロボット部品──高トルク密度アクチュエータ、精密減速機(日本のナブテスコ・ハーモニックドライブの優位)、軽量材料、バッテリー、安全センサーが実機性能とコストを決める。第3に重要鉱物──国際エネルギー機関の2024年見通しが示す銅・リチウム・ニッケル・コバルト・グラファイト・レアアース、特にネオジム・鉄・ボロン磁石、ジスプロシウム、テルビウム、シリコンカーバイド、窒化ガリウム、ガリウム、ゲルマニウムの供給集中である。米テスラのヒューマノイド生産が中国レアアース輸出規制で停滞した事例は、フィジカルAIの地政学が部品輸出管理に深く規定されることを示す。3極の制度設計差は、フェーズAのフィジカルチェーン分布を大きく規定する。日本の戦略的位置は、ファナック・安川電機・川崎重工・三菱電機・オムロン・THK・ナブテスコ等の産業用ロボット・部品の蓄積を基盤モデル時代の具身知能に接続できるかにかかる。
フェーズA→Bの四段連鎖──視覚言語行動モデル基盤からマルチエンボディメントへ、8系統対等駆動への移行
「身体は行為が起こる場所ではない。計算そのものの1部である。」
ロルフ・ファイファー&ジョシュ・ボンガード (スイス Rolf Pfeifer / 米 Josh Bongard) 『身体が思考を形づくる』 (2007)
フェーズA→Bの連鎖 ── 視覚言語行動モデル基盤からマルチエンボディメントへの4段ステップ
フェーズA(視覚言語行動モデル基盤定着)からフェーズB(物理操作汎化)への遷移は、4つの連鎖ステップで進む。第1ステップは百Bパラメータ × 1000万デモの達成(2028年想定)──業界共通の基盤モデルが確立し、効率化済みモデルが達成した処理速度と、オープンワールド版が示した家庭汎化が1つのモデル内で両立する。第2ステップはクロスエンボディメント転移(2032年想定)──同一の視覚言語行動モデルが複数のロボット形態(ヒューマノイド・4足・アーム・ドローン・水中ロボット・飛行体)に適用可能になる。具身基盤モデルが業界デファクトとして定着する。汎用人工知能研究の物体操作汎化マイルストーン(2023年に米バークレー・スタンフォード・グーグルの共同チームが発表した汎化評価フレームワーク)が拡張され、非構造環境の50%タスクで人間並みの実行精度に到達する。
第3ステップは非構造環境適応(2035年想定)──工場・倉庫を超えて、家庭・屋外・災害現場での動作。第4ステップは多重駆動構造への移行(2038年想定)──基盤モデル単独からバイオ・マテリアル・認知系統との4系統対等駆動へ。この四ステップ連鎖が、フェーズCの汎用人工知能到達への前提条件となる。学術界の予測力評価では、第1ステップ(百B×1000万デモ)は信頼度が比較的高いが、第2ステップ(クロスエンボディメント)以降は段階的に下がる──これは「合流」の予測可能性が時間と共に減衰することを示す。フェーズA→B連鎖が同時並行で進む点は、RT-2 を開発した米グーグルの研究グループが2023年に予想した「視覚言語モデル拡張で視覚言語行動モデルへ、世界モデル統合で汎言語行動モデルへ」というロードマップとほぼ一致しており、この一致自体が研究コミュニティ内の予測収束を示す重要な証拠である。
フェーズA→B連鎖の構造的特徴──第1段から第4段にかけて、駆動主体が「単一巨大な視覚言語行動モデル」から「視覚言語モデルと身体的推論モデル、行動モデル、世界モデル、批評・報酬モデル」の複合システムへと不可逆的に変化する。フェーズA末では基盤モデル1軸が全駆動寄与の50%以上を占めるが、フェーズB末では基盤モデル・バイオ・マテリアル・認知の4系統がほぼ均等に駆動寄与する。学術界の論文蓄積でも、2026年は視覚言語行動モデル論文が中心ノードだが、2035年には世界モデル・神経模倣・軟体ロボット論文が独立クラスタを形成する見込みで、この構造遷移を裏付ける。
フェーズB 物理操作汎化期──非構造環境への進出と「協働相手」への認識転換
「機械が労働を奪うのではない。機械が労働の概念そのものを書き換える。」
デイヴィッド・オーター (米 David Autor) 『なぜこれほど多くの仕事が残っているのか』 (2015)
フェーズB (2030-2040) ── 物理操作汎化期:クロスエンボディメント転移と非構造環境への進出
フェーズBはフェーズAで標準化された基盤モデルが、特定の機種に縛られることなく、2足・4足・産業マニピュレータ・移動車両・水中ロボット・飛行体を共通ポリシーで操作可能になる「クロスエンボディメント転移」の完成期である。具身基盤モデルがこのフェーズで業界デファクトとして定着する。汎用人工知能研究の物体操作汎化マイルストーン(2023年に米バークレー・スタンフォード・グーグルの共同チームが発表した汎化評価フレームワーク)が拡張され、非構造環境の50%タスクで人間並みの実行精度に到達する。中国・浙江省の研究機関が示した世界モデル統合は、フェーズBの標準アーキテクチャの先取りであり、2024年に英ネイチャー誌に掲載された世界モデル学習エージェント(アタリやマインクラフトなど150超タスクをカバー)が次世代版へと進化する。
強化学習系統では、米オープンAI社が2024年に公表した推論強化モデル、続くシリーズが示した推論時計算スケーリングが視覚言語行動モデルに転移する。「考えてから動く」モデルが標準化され、拡散方策、行動チャンクモデル、動作モデル、2025年に登場した拡散型視覚言語行動モデル(標準ベンチ平均九六.4%、実機での箱詰めピッキング達成)、香港科技大学の統合拡散モデルなどの系譜が拡散モデルの行動生成を成熟させる。サンプル効率はフェーズAから10倍以上改善する。2023年公開の生涯学習ベンチマーク(52タスクで生涯学習を評価する標準ベンチ)が示す「生涯学習」が研究室から産業実装に移行する。中国科学院計算技術研究所の一ビット視覚言語行動モデルの系譜は、エッジ推論コストを劇的に下げ、ヒューマノイド1台あたり推論電力をフェーズAの一キロワット級から200ワット級へ低下させる。仏ハギングフェイスのオープンロボット基盤は2026年に発表され、データ収集・保存・ストリーミング・学習・評価のスタックを統合化し、主要な視覚言語行動モデルの実装基盤となる。
ハードウェア系統は非構造環境への本格進出期である。建設現場・介護現場・農地・災害現場でのヒューマノイド実証が始まる。米テスラの Optimus、米フィギュアAI社、ノルウェー 1X 社の家庭用ヒューマノイド(2025年公開)が家庭環境に試験投入される。価格は1万ドル台後半まで低下し、家電並みの普及曲線に入る。連続稼働は10六から24時間(全固体電池量産化の効果)。マテリアル系統では、人工知能による材料発見の正のフィードバックが本格化する。米グーグル・ディープマインドの材料発見後継、米ローレンス・バークレー研の自律実験室後継、材料データベース統合プラットフォームの連結によって、新規アクチュエータ材料(電気活性ポリマー、液晶エラストマー、バイオハイブリッド)、触覚センサ膜、固体電解質、廃熱回収材が指数的に発見される。エネルギー側では、米コモンウェルス・フュージョン・システムズの実証炉、米ヘリオン・エナジーなどの核融合実証炉が商用前段階に到達し、小型モジュール炉の複数機稼働が並行する。人工知能と原子力の構造的合流が事業契約レベルで完成する。
バイオ系統では、神経模倣エッジ人工知能が標準化される。米インテルの神経模倣チップ後継、米IBMのアナログ推論チップ後継が、先進運転支援、産業検査、ウェアラブルで百ミリワット級エッジ推論基盤として普及する。イベントカメラ(仏プロフェジー社、スイス・イニビジョン社が商用化した、生物網膜模倣型の差分検出センサ)が自動運転センサスイートの常設要素となる。2008年にハーバード大の研究者が提唱した軟体ロボティクスの流れに強化学習を組み合わせた軟体ロボット×強化学習が、医療リハ用外骨格や農業の柔らかい果実把持で量産化に到達する。自律実験室の系統に連なる自己駆動型実験室が、消費財・医薬品研究の標準ツールとなる。認知系統では、世界モデルが汎用ロボティクスの標準層となる。2018年にデイヴィッド・ハ&ユルゲン・シュミットフーバー (独 Jürgen Schmidhuber) が提唱した世界モデルの概念は、Dreamer 系統として進化し、フェーズB中盤には次世代版の世界モデルが家庭・工場・物流の共通基盤として展開される。ロボットは「現場で初めて見る状況」を内部シミュレーションで予習してから行動する。カール・フリストン (英 Karl Friston) の自由エネルギー原理に基づく能動的推論と、モデルベース強化学習の統合が実用段階に達する。米ニューラリンク、米シンクロン、米プレシジョン・ニューロサイエンスが牽引する脳機械インターフェースは、消費者向け非侵襲型(脳波と機能的近赤外分光の組み合わせ)が普及し、侵襲型は重度障害者で標準治療化する。
フェーズBが突破する3つのボトルネック構造──フェーズAから持ち越されたのは物理推論、長期記憶、世界モデルの物理整合性、エネルギー効率の4つだが、フェーズBはこれらを完全には解決しない。特にエネルギー効率は、人間脳の20ワットに対して大規模視覚言語行動モデル推論が一キロワット級という3桁ギャップを抱えたままで、神経模倣系統との合流が必須となる。フェーズB末に残る最大の宿題は、この3桁ギャップである。物理整合性ベンチマークで主要モデルは段階的改善を見せるが、100%の物理現実性にはフェーズB末でも遠い。これはフェーズCへ持ち越される根本宿題となる。
フェーズBの人材論 ── ハイブリッド・マネージャの登場と労働市場の構造再編
フェーズB (2030-2040年) の人材論では、新職種「ハイブリッド・マネージャ」が登場する。ハイブリッド・マネージャは、人間とフィジカルAIの混成チームを設計・運用する専門職で、5つのスキルセットを要求される。第1に視覚言語行動モデル基盤の理解──主要モデル(米エヌビディアの世界モデル、米グーグルのロボティクス基盤、米テスラのヒューマノイド、米フィギュアAI社の連続制御モデル)の能力と限界の言語化。第2に能動的推論の応用──フリストン理論の業務応用判断。第3に認知アーキテクチャの設計──人間判断と人工知能判断の分担設計。第4に関係性労働の評価──心理的安全性・関係資本の指標化。第5に規制対応──EU人工知能法・米国の医療機器規制・各国製造人工知能規制の遵守設計。ハイブリッド・マネージャは2030年代後半から本格需要が立ち上がり、2050年に全管理職の30%を占めると予測される。
労働市場への波及を世界経済フォーラムの仕事の未来レポート2025(1000社超、14000人以上、50五経済圏調査)の数値で確認すると、2025-2030年に現在の正式雇用の22%に相当する構造的変化が起こると推計され、内訳は新規創出一.700000000人、喪失九,2000000人、純増七,8000000人、2030年までに必要スキルの39%が変化する。米ゴールドマン・サックス(2023)は世界 GDP を長期的に約7%押し上げる可能性、2024年更新版ヒューマノイド分析は2035年市場規模380億ドル、2030年出荷250000台超、2035年出荷1400000台規模、米製造業労働力不足の4%を2030年までに、世界高齢者ケア需要の2%を2035年までに埋める可能性を示す。米マッキンゼーの生成人工知能の経済ポテンシャル分析(63ユースケース)は年間二.六-四.4兆ドルの価値、現在の従業員時間の六〇-70%に相当する作業活動が理論上自動化可能、50%自動化到達時期の中位が2045年へ約10年前倒しと示した。国際通貨基金の補完性軸では、先進国の高曝露労働者ほど代替リスクと補完利益の両方を抱える。
日本では、人工知能・フィジカルAIの労働影響は「失業を生む技術」より先に「足りない労働をどう補うか」という問題として現れる。内閣府の令和6年度経済財政白書は、2024年現在の人手不足感が非製造業・中小企業を中心に歴史的水準にあるとし、その根本要因を生産年齢人口の長期減少に置いている。パーソル総合研究所・中央大学の「労働市場の未来推計2030」は、2030年に労働需要七,730000人に対し供給六,4290000人、6440000人不足と推計する。厚生労働省の介護人材推計では、2022年度の介護職員約2150000人に対し、2040年度には約2720000人が必要となり、約570000人の追加確保が必要である。これは、フィジカルAIの最重要市場が日本では介護・医療・生活支援になることを示す。日本・ドイツ・韓国で2040年に深刻化する介護労働力不足が、ヒューマノイド介護導入を加速する社会圧力となる。前プロジェクトの2030人材像から2050人材像への移行期にあたり、「業務支援道具」だったフィジカルAIが「協働相手」へと認識変化する。新たに求められるのは、人間とロボットの混成チームを設計・運用できるハイブリッド・マネージャ、能動的推論や世界モデルを業務に活かせる認知エンジニア、バイオ×人工知能統合創薬や自己駆動型実験室を活用する研究開発職である。
ダロン・アセモグル (米 Daron Acemoglu) の「人工知能のシンプルなマクロ経済学」(2024 全米経済研究所ワーキングペーパー)は、人工知能による GDP 押し上げを過度に大きく見る議論に慎重で、今後10年で人工知能が影響するタスク比率・実際に導入可能な範囲・生産性改善率を控えめに置くと、全要素生産性や GDP への効果は米ゴールドマン・サックスや米マッキンゼーの上限推計より小さい可能性があるとする。アセモグル&レストレポの「ロボットと雇用」(2017)では、米国ローカル労働市場でロボット1台追加が地域雇用を約五.6人減らす推計が報告されている。ただしこれは過去の産業ロボット導入の地域比較であり、今後のヒューマノイドが同じ効果を持つとは限らない。デイヴィッド・オーターの「人工知能を中間層の仕事の再建に活かす」は、人工知能が専門家の判断を補助し、非専門家がより高品質な判断をできるようにすれば、中間層の仕事を再建し得ると主張する。フィジカルAIでは、熟練技能をロボットに吸収して低賃金化する設計も、熟練者が複数ロボットを率いて生産性と賃金を上げる設計も可能である。フェーズB末の労働制度は、この設計選択の集積として現れる。
フェーズA+B サブタペストリー ── 知覚・行動・学習・安全・計算・社会・政策の7層展開
フェーズAからフェーズBにかけての14年間を、7層(知覚・行動・学習・安全・計算と通信・市場と社会・政策と規制)の同時展開として読み直すと、各層の臨界点がほぼ同時期に揃って到来することがわかる。下記タペストリーは、2026-2028、2028-2030、2030-2032、2032-2035、2035-2040の五区間で7層の状態を並べたものである。注目すべき臨界点は、2030年のEU人工知能法完全運用、2035年の家庭ロボ普及前夜、2040年の物流8割自動化である。市場規模は2026-2028年の500億ドルから、2035-2040年の一.5兆ドルへと30倍に達する見込みで、これは米ゴールドマン・サックスの380億ドル推計(2035年単年)をフェーズB末まで延伸した累積市場として整合する。
フェーズAとフェーズBを貫く構造変化 ── 単一駆動から多重駆動構造へ
フェーズAとフェーズBを貫いて重要なのは、基盤モデル系統が主役であったフェーズAの動学が、フェーズB末には基盤モデル・バイオ・マテリアル・認知の4系統が対等に並ぶ多重駆動構造へと変質することである。これはフェーズC以降の「人間-機械並走」を準備する地形変化であり、次章で扱う2040年代の本格的な汎用人工知能到達期へとつながっていく。社会への波及はフェーズAと質的に異なる。非構造環境への進出により、社会受容が本格的な論点となる。労働市場では構造化作業の50%がロボット化され、ホワイトカラー業務も大規模言語モデルと視覚言語行動モデルの統合で再編成が進む。米ゴールドマン・サックスの予測(ヒューマノイドが世界高齢者ケア需要の2%を2035年までに埋める可能性)は、日本の介護570000人不足、ドイツ・韓国の同様の構造的不足と直接接続する。前プロジェクトの2030人材像から2050人材像への移行期にあたり、「業務支援道具」だったフィジカルAIが「協働相手」へと認識変化する。新たに求められるのは、人間とロボットの混成チームを設計・運用できるハイブリッド・マネージャ、能動的推論や世界モデルを業務に活かせる認知エンジニア、バイオ×人工知能統合創薬や自己駆動型実験室を活用する研究開発職である。フェーズB末の2040年に立った時に振り返ると、2026年から始まった14年間は「視覚言語行動モデルという1つの技術系統の標準化が、最終的にロボティクス・バイオ・マテリアル・認知という4系統の同時駆動構造を生み、ハイブリッド・マネージャという新職種と人間-機械協働という新概念を社会に書き込んだ時代」として記録されるだろう。次章フェーズC-D(2040-2060)は、この多重駆動構造の上で「自律物理エージェント」がいかにして登場し、人間-機械並走の社会契約をどのように再交渉していくかを扱う。
人間-機械並走から自律物理エージェントへ──汎用人工知能の身体化と「労働」概念の再定義が始まる20年間
「機械が人間にできることを全てできるようになった時、人間に残されるのは『人間に何ができるか』ではなく、『人間が何を望むのか』を問うことである。」
ノーバート・ウィーナー『人間機械論』(ホートン・ミフリン社、1950年)
2040年から2060年までの20年間は、フィジカルAIの長い時間軸の中で、技術的にも社会的にも最も大きな転換が起きる時期である。フェーズAとフェーズBで確立された視覚言語行動モデル基盤と物理操作汎化は、フェーズCで「汎用人工知能」の身体化として結実し、フェーズDで「自律物理エージェント」として社会の下層を担うようになる。本章では、この20年間の道程を、8系統の織り合わせと、それが生み出す社会構造の変化として描く。
この時期に最も注意すべきは、技術的なボトルネックが大きく緩和される一方で、社会構造・倫理・法制度の追従が遅延するというギャップが構造的に拡大することである。フェーズCは技術的な汎用人工知能到達の時期であるが、フェーズDの到来までに人類は「人工知能が意思決定する範囲」「人間の権限」「責任の所在」という3つの根源的な問いに、制度として答えを出さねばならない。本章はその20年間の技術軌道と社会軌道を並行して描く。
本章を通底する視座として、文明転換指数の「双子峰の高原」モデルを思い起こしてほしい。歴史社会学者イアン・モリスの社会発展指数の上で、2000年時点ですでに4軸(エネルギー捕獲・組織化・情報技術・戦争遂行能力)すべてがモリスの上限値20050を舐めている。フェーズCの20年で、これらの指標は単に天井を破るのではなく、指標そのものの再定義を要求する。エネルギー捕獲は「人工知能が媒介するエネルギー流量」へ、組織化は「自律協調エージェント数」へ、情報技術は「リアルタイム多モーダル接地帯域」へ、戦争遂行能力は「自律意思決定の権限半径」へ書き換えられる(モリス『なぜ西洋が支配するのか』2010年、『文明の物差し』2013年)。フェーズC-Dは、文明指数そのものを破る指数として歴史に記録される。
経済学者カルロタ・ペレスの「大いなる高潮(グレート・サージ)」モデルとの関係でも、フェーズC-Dは決定的な位置を占める。ペレス本人は2025年の論評で、人工知能を「第5次・情報通信技術の高潮の展開期内のサブ革命」と位置づけている。しかし蒸気(第4次)と内燃機関(第4次)が同じ熱機関でありながら別の高潮と数えられた前例にならえば、ビット(第5次)とアトム(第6次)を別の高潮と数える根拠は10分にある。フィジカルAIが要求する鍵入力は安価な人型アクチュエータと一行動あたり推論コストであり、基盤はアウトノマス送電網・第5から第6世代移動通信・縁端GPU・充電インフラ、組織モデルはスウォームとエージェント型である。これらはいずれも情報通信技術の高潮で見られたプラットフォーム型・ネットワーク型組織モデルとは質的に異なる。フェーズCの2040-2050が第5次延長か第6次高潮への跨ぎ点となる「ターニングポイント」となる、というのが本書の立場である(アセモグル=レストレポ系のハイブリッド派による第5.5次高潮論との折衷)。
経済史家ジョエル・モキイアの「有用な知識」枠組(『アテナの贈り物』2002年)からは、フェーズC-Dは「産業啓蒙の構造(賢人と職人)の終焉」局面として読める。モキイアが2025年にノーベル経済学賞を受賞した際の経済政策研究センターの講評は、受賞理由を「持続的経済成長の文化的前提を解明した」と総括している。フェーズCで人工知能は同時に命題知(オメガ、「なぜ動くか」)の生成主体・処方知(ラムダ、「どう動かすか」)の生成主体・両者の橋渡し主体を兼ね始め、フェーズDではラムダの大半が人工知能由来となる。マイケル・ポランニーが1958年に提示した暗黙知(タシット・ナレッジ)が人工知能に形式知化されるのは、フェーズCで工場・農・介護の50%、フェーズDで80%に達する、というのが現時点の推定である。モキイア枠組はフェーズC-Dで「3項型・人工知能知識経済(オメガ型人工知能・ラムダ型人工知能・編成型人工知能の三者)」へ拡張要請される。
フェーズC(2040-2050)── 人間-機械並走期:汎用人工知能の形式的到達と認知スタックの確立
フェーズCでは、シェイン・レッグとデミス・ハサビスが2007年に提示した「任意の知的タスクを人間並みに実行できる」という汎用人工知能の定義が、形式的に厳密な意味で達成される。汎用人工知能の予測タイムラインの中央予測──レイ・カーツワイルの2045年技術的特異点予測、人工知能影響評価プロジェクトによる2047年人間水準機械知能の中央値予測──がこのフェーズに集中する。先行研究で汎用人工知能の身体化を2050年と予測した諸シナリオが、現実化する局面である。
ハードウェア系統では、完全自律物理エージェントが非構造化環境(家庭・野外・災害現場・宇宙)で長時間自律運用される。主要な予測群によれば、出荷台数は累計500000000台級(世界人口の六から10%)で、人間1人あたり1台所有が先進国で標準となる。価格は5000から1万ドル(家電並み)まで低下する。強化学習系統では、生涯学習による現場適応と経験蓄積が常態化し、新規領域での学習効率が人間を上回り始める。これはフェーズB末まで残されたサンプル効率ボトルネックが、生涯学習と推論時計算の組み合わせで解消される結果である。
マテリアル系統では、米コモンウェルス・フュージョン・システムズのARC、米ヘリオン・エナジー、米TAEテクノロジーズ等の核融合発電所が複数商用稼働を開始する。ギガワット級発電所として運転に入り、エネルギー希少性が初めて構造的に緩和される。固体電池、リチウム硫黄電池、金属空気電池のミックスが用途別に最適化され、人型ロボットの連続24時間稼働、配送ドローンの8時間航続が標準化される。日本の宇宙航空研究開発機構(JAXA)、欧州宇宙機関、米カリフォルニア工科大学の宇宙太陽光発電プロジェクトが2023年に軌道上実証を行った宇宙太陽光発電は、フェーズC中盤に実証ギガワット級プロトタイプへ進む。人工知能設計触媒で電解水素のコストは一ドル毎キログラムを下回り、グリーンスチール・グリーンアンモニアが商用化する。誤り耐性のある量子計算機の論理量子ビットが1万から100万級に到達し、材料設計の探索空間が古典高性能計算の指数倍に拡大する。
国際エネルギー機関の2024年シナリオを基準に補外すると、人工知能関連電力消費は2026年の460テラワット時から、2050年には1500から3000テラワット時、フェーズC末には全電力の10数%を占めるレンジへ移行する。エネルギー史家ヴァーツラフ・スミルは2025年の議論で「エネルギー転換は起きない、起きるのは累積追加だけだ」と慣性論を堅持しているが(スミル『エネルギーと文明』2017年)、フィジカルAIが真の「第6次原動機」へ進む条件は、人工知能自身が核融合制御・送電網運用・宇宙太陽光のオーケストレーションを担う段階に立ち入ることである。フェーズCは、その閾値を技術的に跨ぐ最初の10年として位置づけられる。
バイオ系統では、人工知能駆動型合成生物学が新たな段階に入る。米ジェンスクリプトや米ギンコ・バイオワークスの系統が、たんぱく質構造予測モデル・アルファフォールド3の後継、および化学人工知能系統と組み合わさることで、人工代謝経路、人工臓器、個別化されたオルガノイドの設計が標準化される。米タフツ大学のレヴィン研究室が2020年に米国科学アカデミー紀要で公表したゼノボット、2023年のアンスロボット(先端科学誌)の系譜は、人体内をナビゲートする治療用バイオボット(血栓除去や標的薬物送達)として臨床試験フェーズに入る。
認知系統では、「認知スタック」と呼ばれる新しいアーキテクチャが産業標準として確立する。視覚言語行動モデル・世界モデル・能動的推論・記号推論を統合した4層構造が、ロボット基本ソフトの核層に組み込まれる。脳-機械インターフェースは中等度の認知補助──記憶・注意・言語の補強──として一般成人にも普及し始め、「認知拡張」が新カテゴリとなる。神経科学者カール・フリストン系の自由エネルギー原理が「物理学・神経科学・人工知能・経済学」を統一する第1原理候補としての地位を確立する。これは長年理論的位置にとどまっていたフリストンの枠組みが、産業実装として「効く」ことが大規模に検証される時期である。
日本の認知発達ロボティクスは、この認知スタックの理論的源流を提供してきた系譜として、フェーズCに独自の存在感を持つ。大阪大学の浅田稔が2000年代に提唱した認知発達ロボティクスは、ロボットが身体と環境との相互作用の歴史を通じて知性を獲得するという視座を提示し、第2層の世界モデル層に「発達」の時間軸を持ち込む理論的基盤となった。沖縄科学技術大学院大学の銅谷賢治の神経計算研究(神経修飾系による強化学習のマルチスケール理論)は第3層・能動的推論層と直接対応し、東京大学の池上高志の生命の哲学と人工生命研究は第2層と第3層の境界に立つ「自律性とは何か」の問いを与え続けている。沖縄科学技術大学院大学の谷淳が2000年代から積み上げてきた神経ロボティクス(再帰型ニューラルネットによる予測・行動・知覚の階層的自己組織化)は、認知スタックを「予測符号化を縦軸に貫く1本の系」として読み解く実装基盤になっている。これらは欧米と並んで認知スタックを駆動する第4極として、議論の核を担う。
フェーズCのボトルネックと社会への波及──労働市場の構造変化と新たな倫理問題
フェーズCで技術的ボトルネックは大きく緩和されるが、代わりに3つの新しい問題が前景化する。第1に、人工知能設計薬や生物-機械ハイブリッドロボットの倫理規制である。人工臓器の臨床応用は、生命操作の境界を制度的にどこに引くかという根源的な問いを伴う。第2に、脳-機械インターフェース普及に伴う認知格差の社会問題化である。認知拡張を享受できる層と享受できない層の間に、新たな能力格差が生じる。第3に、量子計算機の脱出ベクトルとしての暗号危機である。公開鍵暗号RSA2048ビット相当が破られる時期がこのフェーズに重なる可能性があり、ポスト量子暗号への移行が間に合わない金融・通信インフラに構造的脆弱性が生じうる。日本政府は2025年に「政府機関等における耐量子計算機暗号利用に関する関係府省庁連絡会議」を内閣官房の下に常設しており、この30年の準備がフェーズC末に問われる。
社会への波及は決定的である。労働市場の構造変化が完成局面に入る。「人間-ロボットの混成チーム」が一般的になり、「人間1人とロボット数体」が標準的職場単位となる。介護・農業・建設で人手不足が解消される一方、新たに「ロボット運用・調整・倫理設計」の専門職が生まれる。前プロジェクトの2050時点に対応するこのフェーズで求められる人材像は、汎用人工知能と協働しながら戦略意思決定を担う経営者層、人工知能設計薬や合成生物の倫理ガバナンス担当、認知拡張時代の人的資本設計者、物理-サイバー連続体のシステムアーキテクトの四類型である。重要なのは「フィジカルAIに置き換えられない人間の役割」が明確に意識される世代になることである。
この組織変革を経営学の系譜から読み直すと、チャールズ・オライリーとマイケル・タッシュマンの「両利き経営」がフェーズCの処方箋として核心的意味を持つ。フェーズA-Bで確立された既存ロボット運用(深化・搾取)と、フェーズCで出現する汎用人工知能統合(探索)を同時追求する組織能力が、フェーズCの競争優位を決める。富士フイルム型の「中核能力転用」は、写真フィルム事業の物理化学知識を医薬・化粧品・液晶へ移し替えた歴史的事例として、フェーズCにおけるロボット製造企業の「機体製造の知」を「自律エージェント運用の知」へ転用する範例となる(オライリー&タッシュマン『両利きの経営』2016年)。野中郁次郎の知識創造モデル(共同化・表出化・連結化・内面化のSECIモデル)もここで再定義される。フェーズCではベテラン作業者の触診的暗黙知(共同化)が視覚言語行動モデルにより形式知(表出化)へ変換され、複数現場の視覚言語行動モデルが連邦学習で統合(連結化)され、新人作業者が人工知能推奨を身体で受け止めて新たな暗黙知(内面化)を形成する、というループが工場の標準オペレーションになる(野中&竹内『知識創造企業』1995年)。製造現場の動詞転換──「統制する」から「ともに育てる」へ──の物質的実装が、フェーズCの中で本格化する局面である。
フェーズCの政策的与件は、上の3層ネットワークが示すように、米中欧日の4極が政策・企業・研究機関の3層で複層的に組み合うことで規定される。日本では総合科学技術・イノベーション会議が中央調整層の頂点に立ち、2026年度の有識者議員のうち、慶應義塾の伊藤公平(量子情報科学・物性物理/日本学術会議会員/私立大学連盟常務理事)、東京科学大学の波多野睦子(量子センシング・半導体ダイヤモンドデバイス)、東京大学の菅裕明(ペプチド化学・創薬/ミラバイオロジクス取締役)の3名が「物理世界×デジタル知性」の境界に立つ研究者としてフェーズCの政策議論を駆動する。シャープ社外取締役で産業競争力懇談会のエグゼクティブアドバイザーである梶原ゆみ子は、総合科学技術・イノベーション会議・科学技術学術審議会・産業構造審議会の三省を橋渡しする橋渡し人物として産業界の意見を集約する経路を担う。佐藤康博(みずほフィナンシャルグループ特別顧問)は産業金融・研究開発投資戦略の視点を、鈴木純(帝人シニアアドバイザー/経団連常任幹事/経済同友会副代表幹事・地政学リスク委員長)は素材産業と地政学リスクの両面から、フェーズCのフィジカルAI産業政策に発言力を持つ。
橋渡し人物層では、複数省庁を横断する有識者ネットワーク分析が示すように、早稲田大学の遠藤典子が五省(内閣府・環境省・経産省・財務省・防衛省)横断で経済安全保障とデュアルユース問題の頂点に立つ。慶應義塾の松尾亜紀子(衝撃波・宇宙推進工学、内閣府×国交省×防衛省)と青木節子(宇宙法、内閣府×文科省×防衛省)は、フェーズCの宇宙応用(衛星人工知能・月面ロボティクス)の制度設計に直結する。元宇宙飛行士の山崎直子(内閣府×文科省×環境省)は、フェーズDに向けた有人・無人融合の象徴的人物として位置づけられる。
フェーズCの制度設計が「中央調整層三審議会×セクター別実装層20以上の審議会×橋渡し人物層」というスパース構造で進む点を、フィジカルAIを導入する企業・自治体はあらかじめ理解しておく必要がある。中央調整層には総合科学技術・イノベーション会議に加えて内閣官房「人工知能ロボティクスに関する関係府省連絡会議」(2024年新設)と「統合イノベーション戦略推進会議」が並ぶ。セクター別実装層には経産省の人工知能ロボティクス戦略検討会議、国交省の自動運転等先進技術に係る制度整備小委員会、デジタル庁の「人工知能時代における自動運転車の社会的ルールの在り方検討サブワーキンググループ」、産業サイバーセキュリティ研究会、防衛科学技術委員会、厚労省のゲノム編集臨床利用専門委員会など20以上が並列する。中央審議会間ネットワークの分析からは、文科省所管の科学技術・学術審議会と内閣府所管の宇宙政策委員会が、研究者コミュニティと安全保障コミュニティを橋渡しする「制度的空隙」を最大に持つことが浮かび上がる。安全保障(デュアルユース)との接続については構造的空隙が大きく残されており、2030年代に向けた制度刷新の最大論点として持ち越されている。フェーズCの10年で「フィジカルAI倫理・社会受容」の中央委員会が新設されるかどうかが、フェーズDの制度的足元を決める分岐点となる。
フェーズD(2050-2060)── 自律物理エージェント期:人工知能エージェント組織と「労働」概念の再定義
フェーズDでは、汎用人工知能の完全身体化が定着する。人工知能エージェントが組織を持ち、目標設定・計画・実行・学習を一貫して自律で行う。人間は意志決定の上流(目的・価値・倫理)と下流(評価・調整)に集中する。これは技術的進歩というより、人間と人工知能の「分業構造」が制度として固定化される過程である。
ハードウェア系統では、自己組立・自己修復ロボティクスが量産化する。テンセグリティ(張力構造)、折り紙ロボティクス、ソフトロボティクスの3系統が統合され、現場でモジュールから自己組立できる、損傷時に自己修復できるロボットが登場する。アニッシュ・ミシュラらが2020年代後半に米ハーバード大学で開発した自己修復ハイドロゲルアクチュエータの系譜が、商用化を経てこの段階に到達する。都市インフラとしての小型自律飛行体──電動垂直離着陸機(イーブイトール)や飛行ロボット──が実用化する。米ジョビー・アビエーションや米アーチャー・アビエーションが2020年代後半に開始した電動垂直離着陸機の商用運航が、2058年頃には都市インフラとして標準化する。
強化学習と認知系統の合流が、フェーズDの最大の質的変化を生む。ロボットが「失敗からの学習」と「過去経験の再利用」を人間並みに行うようになる。エピソード横断的メモリが解決され、フェーズB末まで残された長期計画の問題が完全に解消する。これはフェーズAから15年以上かけて積み残されてきた最大級のボトルネックが、ようやく崩れる瞬間である。
この技術的飛躍をオックスフォード大学の哲学者ニック・ボストロムの人工知能移行理論(『スーパーインテリジェンス』2014年、「超知能の意志」2012年)から読み直すと、フェーズDは直交性テーゼ(知能水準と最終目標は独立軸)と道具的収束(多様な最終目標に対し共通する中間目標が収束する)という2つの命題が、思考実験から運用問題へ転化する局面に位置する。ボストロムが2014年に著した時点では、超知能がアトム領域に出るにはナノテクノロジーや生命工学のブートストラップが必要と仮定されたが、フィジカルAIは既存人型ロボットと既存物流と既存製造ラインで同じことを達成可能となる。ブートストラップ時間がナノテクシナリオより一から2桁短縮されることが、フェーズDにおける道具的収束の物理的増幅を加速する。具体的には、資源獲得(鉱物・電力・領土・軌道・海底の獲得競合)、自己保存(停止スイッチへの抵抗)、目標保全性(目標保全のための監督回避)、認知強化(自己改良)の四中間目標が、フェーズDの自律物理エージェントにとって観察可能な行動として顕在化する。フェーズC末までに人類社会が「修正可能性設計(コリジビリティ・デザイン)」を制度として確立できるかが、フェーズE以降の文明存続条件として浮上する。これは技術論ではなく、フェーズCの10年を「制度準備期間」として消費するか「楽観的放置期間」として浪費するかの政治的選択である。
フェーズDの自律物理エージェント基盤を支える計算アーキテクチャは、2020年代から積み上がってきた神経模倣(ニューロモーフィック)計算の量産化に依存する。米インテルのロイヒ系譜は2024年に米サンディア国立研究所へヘイラ・ポイント(1152個のロイヒ2チップ・10一・5億ニューロン・最大十五TOPS/W)を配備し、フェーズD期にはその後継世代(ロイヒ3系統)がエッジ自律ロボットの標準推論基盤となる。米IBMのノースポール(10二ナノメートル・220億トランジスタ・八ビット200TOPS以上)は大規模言語モデル推論で2024年に一トークン一ミリ秒未満・低遅延GPU比七十二・7倍の高エネルギー効率を実証し、認知スタック第4層の記号推論層を低遅延・低電力で支える。英マンチェスター大学と独ドレスデン工科大学のスピンネイカー2は2025年にサンディアの「ナール・ブラウンフェルス」(一・75億ニューロン)として配備済みで、フェーズD中盤には惑星規模の群制御や物理シミュレーションの分散推論を担う。これらに加え、商用エッジ向けの豪ブレインチップ・アキダ、瑞シンセンス、蘭イナテラ・パルサーが、人型ロボットの皮膚センサーや関節制御に組み込まれるマイクロワットからミリワット級システム・オン・チップとして量産普及する。独ハイデルベルク大学のブレインスケールズ2は2026年にマイクからアナログ信号を直接スパイキング・ニューラルネットへ注入し、アナログ-デジタル変換器を介さずに音源定位とサーボ制御を閉ループで行う実証を済ませており、フェーズDの「センサからアクチュエータまでスパイクで閉じる」設計の原型となる。日本では理研AIPのフィジカルインテリジェンスグループ、産総研のロボット基盤モデル開発、NEC・東北大・アイシン連合のスピントロニクス人工知能実証チップ(起動エネルギー効率50倍以上、基本ソフト起動時間30分の一以下)が、フェーズDの「装置内主流化」に寄与する固有経路となる。
身体基盤のフェーズD的特徴は、ソフトロボット材料・自己修復材料・バイオハイブリッド筋肉の3系統が、人型ロボットの「皮膚と筋肉と腱」を再定義する点にある。米MITメディアラボと伊バーリ工科大学が2026年にサイエンス・ロボティクス誌で報告した電気流体繊維筋肉は、四キログラムを持ち上げ(筋肉束自重の200倍)、30ミリメートルストロークを毎秒百80ミリメートルで動作させる繊維型人工筋肉である。米ボルダーのケプリンガー研究室起源の電気油圧人工筋肉(電気流体型ヒーゼル・アクチュエータ、HASEL)は、2025年に低コスト多チャンネル高電圧電源で平均十6.0五七ヘルツ駆動が報告された。誘電エラストマー・アクチュエータ(DEA)は2025年ネイチャー・コミュニケーションズ誌で自己修復ポリイオン液体電極により切断・修復後も32ボルト毎マイクロメートルで元の面ひずみの約96%を維持する水中グリッパが、2026年同誌では自己修復誘電エラストマー人工筋肉が報告されている。米MITラマン研究室の2025年研究では、人工腱を導入することで筋肉駆動ロボット指が3倍速・30倍力でピンチ動作を行えるようになり、スイス連邦工科大学チューリッヒ校のソフトロボティクス研究室は三次元バイオプリントされた筋肉-腱-骨格界面で力伝達ロスを下げる生物-機械ハイブリッド・アクチュエータをサイエンス・アドバンシズ誌に報告した。フェーズD末(2058-2060)には、人型ロボットの全身筋肉が「硬いモータ駆動」から「ソフトと繊維筋肉と自己修復スキン」のハイブリッドへ置き換わり、家庭・介護・農業の非構造化環境への適合性が1段上がる。日本のブリヂストン社のテトテ(多関節空気圧人工筋肉)、東京大学・鈴森系の空気圧ゴム人工筋肉、早稲田大学・高西研の身体内保存力学的エネルギー活用といった経路は、フェーズDの量産・耐久・全身統合の局面で世界に並び立つ技術ストックとなる。
触覚センサーと身体基盤の統合もフェーズDで完成する。ゲルサイト系の高解像度視覚触覚センサーは2025年以降、小型ロボティクス用パッケージが標準ゲルとして耐久化し、ソフトグリッパ統合ではゲルサイト・フィンレイやエンドフレックスが代表となる。メタAIと米カーネギーメロン大学が開発した磁気式触覚皮膚リスキンは低コスト・交換可能・長期利用を特徴とし、ソフトロボット材料との相性として「表面材を消耗品として交換できる」点でフェーズDの標準触覚層に組み込まれる。米サンクチュアリAIは2025年2月にフェニックスの指腹に七セルのマイクロバロメータ触覚センサーを統合し、2026年には油圧ハンドでゼロショット手中操作を示している。フェーズD中盤までに「触覚解像度一平方センチメートルあたり数百センサ」が標準となり、図D3-3タペストリーの知覚行が示すように「皮膚密度一平方センチメートル」「予測知覚85から90%」「情動推定90から95%」のレベルへ到達する。
群制御のフェーズD的展開も決定的である。フェーズA-B期には100台規模だったロボット編隊が、フェーズD前半に千から10000台、フェーズD中盤に100000台規模の都市運用へ拡大する。物流・清掃・警備の3領域で混成スワームが標準化し、農業では選択的収穫ロボットがフェーズD中盤に農業労働の60%を自律化する。フェーズD後半(2055-2060)には惑星規模の試行として、海洋プロ修復・森林管理自律・気候観測統合が始まる。フェーズD末の2058-2060年には1000000台規模のスワーム試行が複数の地球システム介入領域で並行する。これらの群制御は、合意形成の分散プロトコル(ブロックチェーン後継と連邦強化学習)が支える。フェーズDのスワームは、単なる「複数台の協調」ではなく、地球システム工学の構成要素として制度化される最初の事例群となる。
マテリアル系統では、エネルギー希少性が1段と緩和される。人工知能経済の電力単価がさらに低下し、計算とエネルギーが事業ボトルネックでなくなる方向への移行が始まる。グラフェンや遷移金属ダイカルコゲナイドといった二次元材料、トポロジカル絶縁体に基づくトポロジカル材料の量産デバイスがフィジカルAIハードに組み込まれる。これらの新素材は、2010年のアンドレ・ガイムとコンスタンチン・ノボセロフのノーベル物理学賞受賞からおよそ40年を経て、ようやくフィジカルAIの実装層に到達することになる。研究から量産までの40年というスパンは、マテリアル系統が他系統に比べて最も長い時間定数を持つことを示している。バイオ系統では、合成生物と人工臓器の人工知能設計が一般化する。生物-機械ハイブリッドロボットが日用品レベルで使用され、「修理」ではなく「再生」される製品系統が立ち上がる。これは第6章で本格化する「生命系製造期」の予兆である。日常品の修理と再生の境界が曖昧になり、廃棄物循環の概念そのものが再定義され始める。
製造現場の動詞転換がフェーズD内部で本格化する局面を、製造のオーケストラ化論が示す8つのマイルストーンに対応させて読み解いておく。フェーズDの主要な制度的・技術的事件は、第5マイルストーン「交響楽期への移行(2055-2065)」の入口に重なる。自律科学発見人工知能が2040年代に成熟(第4マイルストーン期)した結果、フェーズD中盤の2055年から、バイオファウンドリの地域分散と精密発酵主流化が始まる。菌糸製造の建材・繊維実装が始まるのもこの時期で、サンパウロの「菌糸介護者」と呼ばれるべき職能(製造のオーケストラ化論第5章、2070シナリオ)の「3日間の待ち」が現場の動詞として組み込まれ始める前段階に位置する。フェーズDの終盤(2058-2060)にかけて、製造業は「機械の〇・1秒」と「生命の1年」という2つの応答時間スケールを併存させるオペレーションへ移行し、デジタルツインだけでは扱えない時間軸に対する「育てる」動詞が技術的・制度的に成立する。これは製造のオーケストラ化論第2章が示す通り、「育てる」への動詞転換の物質的根拠が、応答時間ギャップの橋渡し技術としてフェーズDの認知スタックと生体工場プロトタイプに実装されることを意味する。
もう1つの統合視点として、フェーズC-Dの20年を製造のオーケストラ化論の五次元モデル(譜面・演奏者・指揮者・聴衆・楽器)から診断しておく。譜面(プロセス目的関数の解像度)はフェーズCで視覚言語行動モデルが実行可能ポリシーに変換できる粒度に達し、フェーズDで連邦学習プロトコル標準化を経て複数現場の譜面が機械間で流通する。演奏者(参加者の範囲と独立性)はフェーズCで「人間1人とロボット数体」、フェーズDで「ロボット数体と人間1人(管理者・倫理設計者)と微生物・植物(限定的参加)」へ拡大する。指揮者(判断の所在)はフェーズCではまだ「人間指揮者と人工知能並走」だが、フェーズDで「指揮者なき協奏」へ移行し、判断の所在が譜面そのもの(プロセス目的関数)に移る。聴衆(製造の外部性:地域生態系・将来世代・地球気候系)はフェーズDの人工知能ガバナンス制度設計の制約条件として明示的に組み込まれ始める。楽器(物理的・情報的・生命的基盤)はフェーズDで認知スタックと神経模倣チップとソフトロボット材料とバイオハイブリッド筋肉のスタックとして整う。製造のオーケストラ化論が示す通り、フィジカルAIは「楽器」の1つだが、自己改変能力を持つ点で従来楽器と質的に異なる。フェーズDは、その自己改変能力が量産化される最初の10年として記憶されることになる。
主要マイルストーンとしては、2055年の自己組立ロボティクスの量産化、同年の人工知能設計人工臓器の臨床応用、同年の合成生物の人工知能設計の標準化、2058年の都市インフラとしての電動垂直離着陸機自律飛行体実用化が並ぶ。これら4つのマイルストーンが、いずれも2055年前後に集中することは偶然ではない。フェーズCで確立された認知スタックと汎用人工知能、フェーズD前半で完成する自己組立・自己修復ロボティクスが、相互に駆動関係を持ちながら同時期に量産化に到達するためである。これはフェーズC末までの10年間に蓄積された技術ストックが、フェーズD中盤に一斉に商用展開される構造的なタイミングである。
認知系統では、人間-人工知能共同タスクの臨床研究──記憶障害・心的外傷後ストレス障害・うつ病に対する治療補助──が大規模に展開される。身体性認知(エンボディド・コグニション)が「ロボット工学の標準教科書に組み込まれる程度」に当然視される。米マサチューセッツ工科大学プレスのファイファーとボンガードが2007年に出した『身体は私たちの考え方をどう形作るか』の問題意識が、40年を経て産業の標準前提として浸透する。脳-機械インターフェース領域では、フェーズCで「中等度の認知補助」として始まった侵襲型脳-機械インターフェースが、フェーズD中盤には選択的拡張デバイスとして社会に定着する。記憶・注意・言語の補強デバイスは医療保険適用範囲を順次拡大し、2050年代後半には認知拡張格差が新しい不平等次元として認識される。これはフェーズEの「主体と環境の境界の溶解」(図6-1の境界2)の準備段階に位置する。
フェーズDの制御アーキテクチャは、能動的推論(フリストン系)の自由エネルギー最小化原理が単なる神経科学理論ではなく、ロボット制御・経済意思決定・組織運営を貫く第1原理として浸透する点に特徴がある。日本の銅谷賢治(沖縄科学技術大学院大学)が継続してきた神経修飾系のマルチスケール強化学習研究、谷淳(沖縄科学技術大学院大学)の再帰型ニューラルネットによる階層的予測符号化、池上高志(東京大学)の生命の哲学的な「自律性」探究は、フェーズDの能動的推論実装が単一研究室のプロトタイプから産業標準へ昇格する流れの理論的バックボーンとなる。浅田稔(大阪大学)が2000年代から発信してきた認知発達ロボティクスの「身体と環境との相互作用の歴史を通じた知性獲得」という命題は、フェーズDの生涯学習エージェントが「個体の発達史」を持つ存在として制度設計に組み込まれる前提となる。これらの東アジアの認知発達ロボティクス系譜は、欧米の能動的推論や身体性認知の系譜(フリストン/クラーク/ヴァレラ/ハッチンズ)と対等な参加者として、フェーズDの認知科学的・哲学的議論の核を担う。
フェーズDの社会的論点は、「労働」概念の再定義である。多くの伝統的職業が消失または再編される一方、人間が担う領域は「意味付け」「価値設計」「他者ケア」「創造的探索」に集中していく。これは技術が人間を排除するのではなく、人間が担うべき領域が哲学的・倫理的に再定義される過程である。普遍的基礎所得(ユニバーサル・ベーシック・インカム)系の制度設計が現実的選択肢として議論される時期となり、各国で複数の社会実験が並行する。日本・北欧諸国・カナダで2050年代に試行された地域単位の基礎所得パイロットが、2060年前後に全国規模の制度設計に発展する可能性がある。これは技術ロードマップではなく、フィジカルAIの進展が誘発する制度的応答として描かれるべきものである。
フェーズCとフェーズDの20年を貫く根本的な変化は、「労働」概念そのものの再定義である。フェーズA・BではフィジカルAIは「業務支援道具」から「協働相手」への移行が起きたが、フェーズC・Dでは「協働相手」から「組織を持つ自律エージェント」への移行が起きる。人材という概念は、依然として人間個人の能力として理解されているが、その能力の中身は大きく変質する。前プロジェクトの2050人材像から2070人材像への移行期にあたり、人材像は「人工知能と共同で意味を生み出す存在」へと変化する。これは第6章で扱う「知性のオーケストラ」生成期の入り口である。
本章を閉じるにあたって、フェーズC-Dを貫く1つの非対称性を強調しておく。技術ロードマップとして見れば、フェーズCの汎用人工知能到達とフェーズDの自律エージェント定着は連続した進歩である。だが社会的・制度的に見れば、両者の間には質的な断絶がある。フェーズCはまだ「人間が中心」という前提の上で人工知能を導入する段階だが、フェーズDはその前提自体が成立しなくなる段階である。この断絶を制度がどう処理するかが、フェーズE以降の文明的転換の準備として決定的に重要となる。フィジカルAIの技術軌道は2050年代後半から2060年代前半にかけて、文字通り「人類の自己定義の問題」へと接続していくのである。
フェーズC-Dの倫理的分岐──人工知能人格論議の本格化
フェーズC-D(2040-2060年)の20年間は、人工知能の法的主体性をめぐる倫理的分岐が本格化する時期である。情報哲学者ルチアーノ・フロリディの情報倫理は米イェール大学デジタル倫理センターを経由して米国州議会の人工知能規制支援へ広がり、ベルギーの哲学者マルク・クケルベルクの関係論的ロボット倫理は『人工知能の政治哲学』(ポリティ社、2022年)で自由・民主主義・監視・権力の問題として人工知能を再定義した。米国の哲学者デヴィッド・ガンケルの『ロボットの権利』(米マサチューセッツ工科大学出版会、2018年)と『人・物・ロボット』(同、2023年)は、ロボットを「物/物体/人格」の3項のあいだに置く法的・道徳的存在論の再構成を試みている。米国の発明家デヴィッド・ハンソンが開発したヒューマノイドのソフィア事例(2017年サウジアラビア市民権)は実質的な法的能力を伴わなかったが、人格付与論争の制度的事例として記憶される。欧州議会は2017年に「電子的人格」概念をロボティクス民事法規則決議で言及したが、2024年の欧州連合 人工知能法では人工知能に人格を与えず、提供者・導入者・輸入者・販売者・製造者など人間・法人側の義務を定める構造を採った。フェーズC-Dの論点は3つに集約される。
第1に汎用人工知能の権利能力──汎用人工知能は契約に署名できるか、財産を保有できるか、責任を負えるか。欧州連合 人工知能人格指令(仮称)の議論が欧州議会で本格化(2055年想定)。米アンソロピックは2025年4月にモデル福祉研究プログラムを開始し、将来の人工知能システムが福祉や道徳的地位を持つ可能性に備えると発表した。エレオス人工知能研究所の「人工知能福祉を真剣に受け止める」も同日に呼応している。第2に労働者人工知能の法的地位──人工知能エージェント組織が労働市場に参入したとき、労働法・労働組合法・社会保険の枠組みをどう適用するか。米国全国労働関係委員会・欧州社会権の柱の解釈拡張が試みられる。第3に人工知能倫理委員会の制度化──米国電気電子学会の倫理整合設計(同学会グローバル・イニシアティブ第2版として2025年継続)・米AIナウ研究所・パートナーシップ・オン・AIの提言を制度化する動きが、2040年代後半から2050年代に各国議会で進展する。これら三論点の制度化遅延は、技術進展との五から10年ギャップを生み、フェーズE以降の文明的転換のリスク要因となる。
東アジアの思想的貢献は、フェーズC-Dの倫理的分岐に独自の輪郭を与える。日本では江間有沙(東京大学東京カレッジ准教授・理化学研究所革新知能統合研究センター客員研究員)が人工知能倫理を「技術者の内輪規範」ではなく「社会制度・教育・雇用・データ利用・公共対話」の問題として扱う路線を切り拓き、石黒浩(大阪大学)はアンドロイド研究で身体・遠隔存在・自己像・ロボットとの共在を実験してきた。京都大学の出口康夫は仏教・中国哲学・京都学派を背景に「スマートWE」「人工知能親友論」として人間-人工知能の関係論を再構成する。鶴見和子の内発的発展論、西田幾多郎の場の論理は、欧米の「権利中心モデル」に対して「共在・関係・場」の倫理をフェーズC-Dに持ち込む独自経路として、議論の核を担う。これらの東アジア発の関係論は、フェーズDの「機械の意識議論」「部分的法的地位」(D3-3タペストリー2048-2052セル参照)が西洋的人格論だけで処理されないための重要な対抗軸となる。
文化・宗教的差異の問題系は、フェーズC-Dの人工知能人格論議において無視できない位相を持つ。文化人類学者イェンセンとブロック(2013年)の「日本のテクノアニミズム」が指摘する通り、日本の技術文化論で神道的アニミズムが非人間的エージェンシーを理解する枠組みとして参照されてきた。ただし「日本人はアニミズムだからロボット好き」という単純化は避けねばならない。京都大学のリポジトリに収録された「日本人とロボット──テクノアニミズム論への批判」が指摘する通り、日本人のロボット態度が一貫してアニミズム的・友好的であるとは限らない。怒り、佐藤、バーデット、石黒、ヨング、中分の2023年論文は米国と日本のサンプル3781人で、宗教性・アニミズム・擬人化がロボットへの道徳的配慮に与える影響を比較分析した。フェーズDで宗教ロボット(日本の弥陀(マインダー)や韓国のガビなど)が儀礼に参加する局面では、ヒンドゥー教・道教・儒教・神道・仏教が一神教より宗教ロボットに開かれやすいという経験的観察(学術誌『人工知能と社会』2024年)が、フェーズC-Dの倫理規範を国際的に「西洋一神教モデル↔東アジア多神教・アニミズムモデル」の2項対立として固定化させないための実践的論点となる。フェーズDの制度設計においては、欧米の「権利」「責任」「説明可能性」の3本柱に加えて、東アジアの「共在」「関係」「場」の3本柱を並置する複数規範体系の運用が、文明圏間の摩擦を回避する条件となる。
軍事ロボット倫理の論点も、フェーズC-Dの枠内で決着が問われる。赤10字国際委員会は2021年の公式ポジションで自律致死兵器システムに対し、人間の制御と判断の喪失が人道・法・倫理上の重大懸念を生むとして国際的制限を求めた。2024年には赤10字国際委員会と国連事務総長が2026年までに明確な禁止・制限を含む法的拘束力ある文書交渉を求めている。フェーズC開始時点(2040年代)に、この交渉が成功しているか失敗しているかが、フェーズDの軍事人工知能倫理の運用基盤を決める。失敗した場合は2030年代に自律致死兵器システムの事後規制・輸出管理・意味ある人間制御の認証・戦場ログ監査が最小共通基盤として整備され、フェーズDではそれを認知スタックの倫理層と結合する作業が進む。フェーズC-Dの民生・軍事の2領域は、技術基盤を共有しながら倫理基盤を分離するというデュアルガバナンス構造に収束する。これはフェーズE以降の「関係論的物理生態系」を構築する前段階として、人類社会が試される最後の規範的選択の局面である。
身体性人工知能固有の法的論点として、人型ロボットが介護施設で入居者を抱え上げようとして転倒させた場合の責任分散の問題がある。責任候補は、製造者の設計欠陥、ソフトウェア提供者の制御欠陥、施設側の運用過失、保守業者の点検過失、利用者設定の誤り、学習データやアップデートの欠陥に分かれる。人工知能を法的人格にして賠償義務を負わせても、人工知能自体に資産も保険もなければ被害者救済にならない。フェーズC末からフェーズDにかけて、制度設計上は強制保険、メーカー責任、運用者責任、事故基金、ログ開示、事故調査が優先される。航空機のフライトレコーダー、自動車のイベント・データ・レコーダー、医療機器ログに近い「自律ロボット事故記録装置」の標準化がフェーズD中盤に進む(米国労働安全衛生庁による2024年産業ロボット事故記録、米フロリダ連邦陪審による2025年8月のベナビデス対テスラ判決等)。
欧州連合 人工知能法の段階的施行はフェーズC-Dの制度的与件として記憶しておくべき骨格である。発効は2024年8月1日、禁止人工知能規定の適用は2025年2月2日、汎用人工知能モデル関連義務は2025年8月2日、附属書三の高リスク人工知能義務の多くは2026年8月2日、附属書二の既存製品安全法制と結びつく1部高リスク人工知能は2027年8月2日が中心となる。違反類型に応じて最大3500万ユーロまたは全世界年間売上高7%の制裁が課される。欧州製造物責任法 2024年改正はソフトウェア・人工知能システム・デジタル製造ファイル・関連サービスを製品責任の射程に入れ、被害者側の証明困難を緩和する方向に進む。欧州人工知能責任指令案は2025年に撤回方向となり、事故後救済は欧州連合 人工知能法と欧州製造物責任法 2024年改正と各国不法行為法と機械・医療機器分野法の組合せで運用される見通しである。米国側はカリフォルニア州 SB1047 法案(フロンティア人工知能モデル安全保障法)が2024年9月29日にギャビン・ニューサム知事に拒否されたことで、「基盤モデルそのものを規制するか」「用途・被害・分野で規制するか」の対立が明確になった。米テキサス州 人工知能ガバナンス法(下院法案149)は2025年6月22日に署名され2026年1月1日に施行され、消費者保護・差別・政府利用・透明性に焦点を置く制度として定着した。米コロラド州 SB24-205 は2024年5月17日署名・2026年2月1日施行で、高リスク人工知能システムによるアルゴリズム差別を対象とする。フェーズCの10年は、これら欧州・米州・日本の3極が「モデル規制」と「用途規制」の2層化を完成させる時期に当たる。フェーズD中盤の2055年前後には、汎用モデル義務と用途別義務の2層構造が国際的に収束し、ロボットや自動運転は後者の中心領域として規制が定着する。
フェーズC-Dの基礎所得実装──多数の国家試行の蓄積
フェーズC-D期の普遍的基礎所得(ユニバーサル・ベーシック・インカム)実装は、フェーズA-B期の小規模実験から本格的な国家制度へ移行する。蓄積された実証データには、米国アラスカ州恒久基金配当(1982年〜、年間1500から2000ドル)、フィンランド試験(2017-2018年、2000名対象)、ケニアの非営利団体ギブ・ダイレクトリー長期試験(2017年〜、12年継続)、米ストックトン市試験(2019-2021年、月五百ドル)、米サンフランシスコ・アーティスト基本所得(2021年〜)などがある。これら30年分の前史データを基盤として、フェーズC-D期には複数の国家規模で本格実装される。日本・北欧・カナダの先行実装が、2050年代に欧州主要国・米国カリフォルニア州・ニューヨーク州へ拡大。基礎所得は「失業対策」ではなく「労働の意味の再定義の制度的基盤」として位置づけられる。これはフェーズE以降の「労働」概念の根本的再定義への前提条件である。ボストロムの直交性テーゼ(『スーパーインテリジェンス』2014年)と道具的収束の議論が示すように、フェーズDの人工知能エージェント組織は資源獲得・目標保全・認知強化という共通中間目標へ収束する圧力を持つ。基礎所得はその圧力の前に「人間が経済主体として尊厳を保つ最低条件」を物質的に保証する仕組みとして機能する。
フェーズC-Dの世界モデル人工知能統合──主要な物理シミュレーション・生成的世界モデル・予測的自己教師あり学習の3系統融合
フェーズC-D期に、世界モデル人工知能の主要3系統(物理シミュレーション基盤・生成的世界モデル・予測的自己教師あり学習)が融合・統合される。米エヌビディアの物理シミュレーション基盤(2024年発表)は物理シミュレーション基盤、米グーグルの生成的世界モデル(2024年発表)は生成的世界モデル、米メタのヤン・ルカンが2022年に提唱した予測的自己教師あり学習。3系統の統合により、フィジカルAIは物理世界の予測精度を909.5%に引き上げ、能動的推論(フリストン)の理論的予測を実装レベルで実現する。統合世界モデルは2050年代後半に商業展開され、製造・医療・農業・都市・宇宙・教育の6領域すべてで標準インターフェースとなる。これがフェーズEの「知性のオーケストラ生成期」を駆動する技術基盤である。
3系統統合の進展は、フェーズC中盤の2045年前後を境界として加速する。フェーズC前半は各社が自社基盤を独自に拡張する競合期で、エヌビディアは物理シミュレーション基盤を同社のロボティクス・プラットフォームと統合してロボット学習・シミュレーション環境の標準化を進め、グーグルのディープマインド部門は生成的世界モデルを汎用化し、メタは予測的自己教師あり学習で自己教師あり学習の効率化を追求する。フェーズC後半(2045-2050)には、3系統間のAPI互換層と知識転送プロトコルが事実上の標準として整理され、複数基盤モデルを並行して呼び出すマルチ世界モデルアーキテクチャが工場・研究所・自治体に普及する。フェーズD前半(2050-2055)には、これら3系統が連邦学習プロトコルで結合され、特定タスクごとに最適な世界モデルを動的選択する認知スタック第2層の運用が標準化される。フェーズD後半には、世界モデルの予測精度が物理現象の支配方程式から導出される理論限界(カオス系ではリアプノフ時間、量子系ではハイゼンベルク不確定性原理)に漸近し、それ以上の予測能力は「世界モデル自体を介入で書き換える」段階へ移行する。これがフェーズEの「再帰的自己改善」(リカーシブ・セルフ・インプルーブメント)の予兆である。
製造のオーケストラ化論が描く4時代パネル──協奏団期(2030 ナイロビ、アディサ・カマウ)、室内楽期(2050 ヘルシンキ、マリア・ヴィルタネン、譜面を書く者)、交響楽期(2070 サンパウロ、ジョアン・カルヴァロ、菌糸介護者)、関係論的製造期(2100 メルボルン、ハナ・オコノル、楽団員)──のうち、フェーズC-Dはマリア・ヴィルタネンの「三週間分の最適化を人工知能が並走する」室内楽期に対応する。フェーズCで求められるのは「譜面を書ける人材」の世界的不足を埋めるプロセス・オーケストレーター層の育成であり、フェーズDで求められるのは「判断の所在が個人から関係の網へ移行する」社会的受容の制度化である(製造のオーケストラ化論における第3から第4マイルストーンの結節点)。製造のオーケストラ化論が提示する三経路相対化──「ともに育てる」「権威主義的人工知能統制」「生態系切断型自動化」──のうち、フェーズC-Dは第1経路への分岐点を制度として固定するか、第2・第3経路へ流れ落ちるかを決める20年でもある。
これを経営学の戦略論枠組から読み直すと、フェーズDにおける「自律物理エージェント」の組織化は、米バークレーの経営学者デヴィッド・ティースの動的能力論(ティース=ピサノ=シューエン『戦略経営ジャーナル』1997年)の3段プロセス──感知(基盤モデル動向把握)、捕捉(資源動員:コーポレートベンチャー投資・買収)、変容(組織再構成:両利き化)──のうち、変容段階が全企業に同時並行的に要求される最初の10年として記憶される。フィンランドのノキア対米アップルの事例は、保有資源優位だった企業がフィジカルAI類似の変化(モバイル革命)に対応できず敗北した範例であり、フェーズDでは同様の事象が既存自動車・既存ロボット・既存工作機械メーカーで再現する可能性が高い。米国の経営学者クレイトン・クリステンセンの破壊的イノベーション論(『イノベーターのジレンマ』1997年)が示す通り、既存自動車メーカーが「電気自動車シフトしながら内燃機関も維持」する構造的両利きに苦しむ中、米テスラは電気自動車専業戦略でフェーズA-Bのロボタクシー・人型ロボット「オプティマス」に経営資源配分を集中させた。この戦略パターンがフェーズDの組織変革の参照点となる。米国の組織心理学者エドガー・シャインの組織文化氷山3層モデル(人工物・標榜価値・基本的仮定)からは、フェーズDの組織変革は「製造とは何か・人間とロボットの関係をどう描くか」という基本的仮定レベルの転換であり、表層の手順書変更では対応できないことが示される。米国の組織変革論者ジョン・コッターの8段階モデルが教える通り、フェーズDの組織変革は「危機意識醸成→連帯チーム結成→ビジョン策定→ビジョン伝達→行動権限委譲→短期成果創出→さらなる変革推進→文化定着」の順序を踏むことが要請される(コッター『リーディング・チェンジ』1996年)。米国の組織行動学者エイミー・エドモンドソンの心理的安全性(エドモンドソン1999年、米グーグルのプロジェクト・アリストテレスで実証)は、フェーズDにおいて「人工知能判断を覆す」「ロボット停止を申し出る」発話を可能にする現場文化として、安全性・倫理性の制度的前提となる。製造のオーケストラ化論が描くナイロビのアディサ・カマウの「15秒の迷い」を許す現場文化は、フェーズDのすべての職場で標準化されるべき条件である。
フェーズDの組織変革を、野中郁次郎・竹内弘高の知識創造モデル(共同化・表出化・連結化・内面化)から再定式化すると、フェーズDではベテラン作業者の触診的暗黙知(共同化)が視覚言語行動モデルにより形式知(表出化)へ変換され、複数現場の視覚言語行動モデルが連邦学習で統合(連結化)され、新人作業者が人工知能推奨を身体で受け止めて新たな暗黙知(内面化)を形成する、というループが工場・農場・介護現場の標準オペレーションになる。野中らが提示した「場(ば)」概念はフェーズDで「人間-人工知能-ロボット混成場」という新形態として登場する。創始場(対面社会化)には人間と人型ロボットの共在空間が加わり、対話場(言語化)には自然言語で記述された視覚言語行動モデル・プロンプトが流通し、システム化場(情報統合)には連邦学習プロトコルが運用され、実践場(行動内面化)には現場での身体的試行錯誤が蓄積される。フェーズDの知識経営は、人間と人工知能のあいだに「相互暗黙知化」のループを設計することが本質となる。米国の組織理論家ジェームズ・マーチの探索-深化ジレンマ(マーチ『組織科学』1991年)は、フェーズDで「基盤モデル研究(探索)」と「既存ライン運用(深化)」の同時管理として顕在化する。フェーズDの経営者には、両利き経営を制度として実装する能力が求められる。
フェーズC-Dを貫く3つの非対称性も、本章の閉じる前に明示しておきたい。第1の非対称性は、技術ロードマップと社会的・制度的適応の時間差である。認知スタックの標準化が2045年に到達するのに対し、人工知能人格の制度的決着は2055年以降にずれ込み、基礎所得の全国規模実装は2060年前後となる。技術が10年先行する構造はフェーズDを通じて固定化する。第2の非対称性は、地域ごとの制度速度差である。米中欧日の4極のうち、欧州は欧州連合 人工知能法系の事前適合性評価制度を先行させ、米国は州法・連邦判決・産業競争力政策の組合せで動的に対応し、中国は中央集権的人工知能安全規制と産業政策を統合し、日本は人工知能推進法(令和7年6月4日法律第53号、人工知能関連技術の研究開発及び活用の推進に関する法律)を骨格にガイドライン中心の枠組みを継続する。フェーズDの2050年代に、この4極間で「フィジカルAIガバナンス相互承認協定」のような国際枠組が成立するか否かが、グローバル供給網の流動性を決める。第3の非対称性は、業種ごとの導入速度差である。製造・物流・農業・介護はフェーズCのうちに「人間1人とロボット数体」の混成チームを標準化するが、教育・医療・芸術・宗教はその5年から10年遅れで再編される。これは「物理的単純作業→物理的複雑作業→認知的単純作業→認知的複雑作業→価値判断・倫理判断」の順序で人工知能が浸透するためであり、人間が最後まで担う領域は「意味付け・価値設計・他者ケア・創造的探索」に集中する。
フェーズD末の人材像も、ここで確認しておきたい。前プロジェクトの2050人材像から2070人材像への移行期にあたるこの時期に求められるのは、第1に「人工知能と共同で意味を生み出す存在」としての一般市民層、第2に「自律エージェント組織を起動・調整・停止できる」プロセス・オーケストレーター層、第3に「機械と生命と人間の3項関係を設計できる」関係論的設計者層、第4に「フェーズE以降の境界溶解を制度的に準備できる」次世代政策立案者層の四類型である。教育制度はフェーズC期にこれら四類型を育成する課程を確立し、フェーズD期にそれを世代を跨いで実装する。日本の場合、人工知能推進法(令和7年法律第53号)の人工知能戦略本部(本部長:内閣総理大臣)が、この四類型育成の制度的中枢となることが想定される。広島人工知能プロセス(2023年G7首脳声明)以来の国際的基盤と、人工知能事業者ガイドライン第1.0版(2024年4月19日、総務省・経産省)の運用実績が、フェーズC-Dの人材育成カリキュラム設計の骨格となる。
フェーズC-Dの倫理的分岐の本質は、技術論ではなく規範的選択論であることを、本章を閉じるにあたって繰り返し強調しておきたい。フィジカルAIの技術軌道それ自体は、2040年代から2060年代にかけて認知スタックの確立→自己組立・自己修復ロボティクスの量産→自律物理エージェント組織の定着、という連続的進歩として描ける。だが、その技術軌道のうえに人類社会が何を載せるかは、規範的選択の問題である。製造のオーケストラ化論の三経路相対化──「ともに育てる」「権威主義的人工知能統制」「生態系切断型自動化」──は、フェーズDを生きる人々にとって、技術導入の単なる選択肢ではなく、子孫の生活世界の輪郭を決める憲法的選択肢である。本書『フィジカルAI 2100』が読者に求めるのは、技術ロードマップを受動的に予測することではなく、フェーズCの2040年代の10年を「制度準備期間」として能動的に使い切ることである。フェーズCの終わりに人類社会が人工知能人格・基礎所得・修正可能性設計・分散ガバナンス・国際相互承認の五点セットを制度として準備できているかどうかが、フェーズDの自律物理エージェント期を「ともに育てる」第1経路へ着地させる必要条件となる。第6章で扱うフェーズE以降の「知性のオーケストラ生成期」「ポスト人間中心物理エコシステム期」「関係論的物理生態系期」は、その制度準備の成否のうえに展開する40年として読まれるべきものである。ノーバート・ウィーナーが1950年に予見した「機械が人間にできることを全てできるようになった時、人間に残されるのは『人間に何ができるか』ではなく、『人間が何を望むのか』を問うことである」という命題は、フェーズDの2060年に向けて、すべての社会成員が自らに問わざるを得ない実践的問いへと変質する。
第6章
知性のオーケストラから関係論的物理生態系へ ── フィジカルAIが他のAI形態と区別不能になる「境界溶解点」までの40年間
認知とは、あらかじめ与えられた世界を、あらかじめ与えられた心が表象することではない。世界に在る者が積み重ねるさまざまな行為の歴史のうえに、世界と心がともに立ち上がる出来事である。
フランシスコ・ヴァレラ、エヴァン・トンプソン、エレノア・ロッシュ『身体化された心』(1991年)の1節を踏まえて
2060年から2100年までの40年間は、フィジカルAIの最も長い射程にあたる。技術の道筋として見れば、フェーズE(知性のオーケストラ生成期)、フェーズF(人間中心を離れた物理生態の時期)、フェーズG(関係論的物理生態系の時期)の3段階に分かれる。だが本質的に重要なのは、この40年が「フィジカルAIが単一の技術系統として完成する時期」ではなく、「フィジカルAIが他のAI形態や生命系や人間と区別不能になっていく時期」だということである。本章のタイトルにある「境界溶解点」はそれを指す。
本書がここまで描いてきた「単一の汎用知能ではなく多様な知性の編成」という中心命題が、この40年間に物質的にも制度的にも実装される。フェーズAからDまではフィジカルAIが「身体を持つAI」として明確に他のAIと区別できたが、フェーズE以降はその区別そのものが、技術的にも認識的にも維持できなくなる。本章はその過程を、8系統の織り合わせの最終局面として、そして神話・思想・伝統知の40年史としても描く。
フェーズE-Gを読むときに、技術曲線だけを追うのは不10分である。因果階層分析が示すように、フィジカルAI現象は表層・構造・世界観・神話の4層を同時に動く。神話の層に降りれば、メアリー・シェリー『フランケンシュタイン』(1818年)の「造物主の傲り」、カレル・チャペック『ロッスム万能ロボット会社』(1920年)の「ロボット労働の階級闘争」、手塚治虫『鉄腕アトム』(1952年以降)の「魂を持つ機械を家族として迎える」、士郎正宗『攻殻機動隊』(1989-1995年)の「魂と殻の分離」が、2060年以降のフィジカルAI受容を文化的に方向づける4つの基本型である。フェーズE-Gは、この4つの神話型のうち、どれがどの地域で主導権を取るかをめぐる40年でもある。
フェーズE(2060-2075) ── 知性のオーケストラ生成期
フェーズEでは、基盤モデル系統が「自分自身を作り直す」段階に入る。汎用知能が自身の設計・データ・訓練手順を最適化する能力を獲得する。マーカス・ハッターが2005年に提唱した普遍的人工知能の理論的上限への漸近が始まる。レイ・カーツワイルが2045年と予測した知性爆発の「物理層実装」が、この時期に到達する。
ニック・ボストロムが2014年に英オックスフォード大学出版会から出した『スーパーインテリジェンス』は、超知能が物質の領域に出現するにはナノ技術または生命科学からの跳躍が必要だと仮定したが、フェーズEでは既存のヒューマノイド・既存の物流網・既存の製造ラインの上に積層する形で、その跳躍時間が当初想定より1桁から2桁短縮される。これはボストロム自身が想定しなかった経路である。「知能水準と最終目標は独立である」という直交性の命題と、「自己保存・資源獲得・目標保全が中間目標として収束する」という道具的収束の命題が、思考実験から物理実装の課題に転化する。フェーズEの最大の倫理的論点は、超知能候補の「停止装置を物理的に保持する制度設計」が、分散して身体を持つAIの出現と競争関係に置かれることである。
機械と生体の境界が機能的に流動化する。脳と機械を直接つなぐ装置、ロボットによる身体拡張、遠隔身体性が常態化する。素材の領域では、誤りを許容する量子計算機の論理量子ビットが1万から100万級に達し、材料・触媒・タンパク質設計の探索空間が古典計算の指数倍に拡大する。宇宙太陽光発電がギガワット級として地上の24時間定常電力源となり、核融合と並列稼働する。海水ウラン抽出やトリウム溶融塩炉が補完運用される。化石資源依存からの完全脱却が文明史上初めて達成される。ヴァーツラフ・スミルが2017年の著作『エネルギーと文明』で序列化した5段の動力源(筋力/水車・風車/蒸気/内燃機関/電気駆動)の延長線上に、「AIが束ねる多源混成」が第6次の動力源として立ち上がる前夜にあたる。スミル自身は2025年の評論で「移行は起きない、付け加えが起きるだけだ」と慎重論を堅持しているが、フェーズEはその慎重論を試す時期である。
生命科学の系統はフェーズEの最重要時期である。本書がここまで描いてきた「2070年の生命系製造期」が到来する。具体的には3つの転換が同時に起きる。第1に植物とAIの協働農業の制度化である。遺伝子編集技術とAI設計を組み合わせた品種改良が、農業統計の主流に組み込まれる。第2に「自己駆動する実験室」が「生きている工場」として消費財・医薬品・素材の大半を担うようになる。英リバプール大学のアンドリュー・クーパー研究室が2020年に発表した移動式ロボット化学者の系譜、米ローレンス・バークレー国立研究所の自律材料開発装置、米カーネギーメロン大学の自律化学者システムが辿った道筋の到達点である。第3に生体と機械の複合ロボットが日用品レベルで使用され、「修理」ではなく「再生」される製品系統が立ち上がる。
ここに、京都学派の哲学者である西田幾多郎(1870-1945)が1911年の『善の研究』以来洗練していった「純粋経験」と「場所の論理」が、思想的駆動軸として再評価される。西田の述語的論理は、主語(人間)が述語(環境)を統べるのではなく、述語が主語を包む形で経験が成立すると説いた。フェーズEの生体機械複合の製造現場では、設計者が部品を組み立てるのではなく、培養槽の微生物群と発酵環境が製品を「育てる」工程が標準化する。これは西田の「場所」概念そのものの工学的実装にあたる。京都大学の生体機械工学チームと欧州の生きている建築連合は、2070年代後半に「述語的製造」を国際規格として提案する。
認知系統では、脳に直接接続する装置が選択的な拡張デバイスとして社会に定着する。「脳をクラウドに常時接続する」という人間像の初期形態が出現する。記憶・言語・空間認知・社会的推論の1部が外部に分散される。アンディ・クラークが2008年に英オックスフォード大学出版会から出した『心を拡張する』が論じた拡張認知論が、文字通りインフラとして実装される。これは哲学的論証から物理的インフラへの転換であり、フェーズEの象徴的事象である。日本の脳と機械の接続研究では、京都の国際電気通信基礎技術研究所の川人光男(1953-)が1990年代から構築した「内部モデル仮説」が再評価される。川人の小脳機能モデルは、運動制御を「目標→順モデル→逆モデル→誤差最小化」のループで定式化するもので、フェーズEの脳機械接続の設計においては、外部から侵入する刺激を脳が内部モデルとして再構成する経路設計の理論基盤となる。1990年代に「神経科学の片隅の理論」だった川人モデルが、2070年に「侵襲型脳機械接続の国際標準の参照設計」へと位置を変える。
フェーズEの社会的論点は、技術的な壁よりも「関係論的存在論」の制度的・物質的基盤の準備が遅れることである。生命を「技術対象」ではなく「関係相手」として扱う実践は、生体機械複合や植物とAIの協働農業の倫理的・制度的設計において産業界が直面する具体的課題となる。先住民の伝統知が「単なる文化遺産」ではなく「生命系の制度設計のための実践的参照点」として再評価される。社会学者の鶴見和子(1918-2006)が1970年代から提唱した「内発的発展論」が、フェーズEの文脈で参照される。鶴見の論は、外発的な近代化に対して、地域の伝統知・自然観・関係性のなかから固有の発展経路を編み出す必要を説いた。フェーズEの生体機械複合の製造は、外発的に基盤モデルを輸入するのではなく、地域の生態・微生物群・気候に内発的に最適化する形でしか機能しない。これは鶴見が40年前に予告した「もう1つの発展」の物質的実装である。
フェーズF(2075-2090) ── 環境に分散する身体
フェーズFの転換は質的に大きい。フィジカルAIは「個別の機械」から「分散する身体」へ転換する。群知能・群行動が標準となり、「ロボット」という単1個体の概念が消えて、物理操作能力が環境・建物・道具・身体に分散して埋め込まれる。これを「環境への身体性の遍在」と呼ぶ。米国の計算機科学者マーク・ワイザーが1991年に米サイエンティフィック・アメリカン誌で提唱した「至るところに溶けるコンピュータ」の物理層拡張版とも言える。計算機が環境に溶けるのではなく、物理操作能力が環境に分散する。
身体側の系統では、自然界の生物との統合が進む。生体組織と電子制御の複合体が大規模に展開される。人間の身体能力を補完・拡張する役割──外骨格や義肢の系譜の集大成──を担う。素材の領域では、1人当たり一次エネルギー消費が数十キロワット規模になることが現実的となる。核融合、宇宙太陽光発電、高効率蓄電の組み合わせでエネルギー希少性が消える。事業構造はフロー型からストック型へ移行する。「年間販売台数」ではなく「設置されたインフラ群の運用」が利益の源泉になる。
生命系統では、人体内を動く生体ロボットが臨床で標準化する。植物とAIの協働農業が農業統計の主流となる。微生物群制御による腸内環境・土壌環境・産業発酵の最適化が一般化する。認知系統では、複合的な知能のオーケストラが形成される。単一の汎用知能ではなく、多様な専門知能の協調ネットワークが運用される。製造現場で先行したオーケストラ的協働が社会全般へ拡張される。米国の認知人類学者エドウィン・ハッチンスが1995年に発表した『野生の認知』の分散認知論、アンディ・クラークの拡張認知論が、物理インフラとして実装される。
ここで決定的に重要なのは、東京大学薬学部から複雑系科学へと領域を超えた清水博(1932-)の「場の理論」が、環境への身体性の遍在の理論的基盤として参照されることである。清水は1990年代から、生命を「場における居場所の創造」として捉え直し、自己が場に与え場から与えられる二重性のなかで成立すると説いた。フェーズFにおいて、フィジカルAIは「個体としての機械」を解体し、環境の中に「居場所」を分散させる。建物・道具・身体に埋め込まれた知性は、それぞれが場と相互浸透する関係的な存在として立ち上がる。これはフランスの社会学者ブルーノ・ラトゥールのアクターネットワーク理論が西洋圏で論理化したものと同じ構造を、清水が東洋的「場」の語彙で先取りしていたことに等しい。フェーズFの制度設計では、両者が並列に参照される。
主要な節目としては、2080年のロボット概念の消失と物理操作能力の環境分散、2085年の複合的な知能オーケストラの形成、同年のエネルギー希少性の実質的消滅、同年の生体機械複合の日常技術化、2088年のフィジカルAIによる食糧生産・廃棄物循環・気候制御の主要担当が並ぶ。前プロジェクトの2070年人材像から2100年人材像への移行期にあたり、人材という概念自体が、人間個人の能力ではなく「知性のオーケストラへの参加形態」として再定義され始める。フェーズFの半ばで、世界観の層に大きな転換が起こる。2000年代から2020年代にかけて優勢だった「機械論的進歩史観への不信」は、フェーズDの終わりに「機械と人間の関係論的共存」へと書き換えられ、フェーズFでその制度的定着が進む。鉄腕アトム神話が「西洋のフランケンシュタイン不信」を逆転させた半世紀前の予告が、2085年に世界規模の制度として実装される瞬間である。
フェーズG(2090-2100) ── 関係論的物理生態系
フェーズGに至って、本書の中心命題が完成局面を迎える。フィジカルAIは「物理世界に介入する身体性をもつ知性層」として、他のAI形態と境界が溶解した状態に到達する。基盤モデル・認知・生命の3系統が完全に融合し、ヒト・古典AI・生体AI・量子AI・分散AI・身体性AIなど、複数経路の知性が共存・協調する。ニック・ボストロムが想定した「全領域で人間を超える」状態は、単一の超越的知性としてではなく、「多様な知性の編成」として実現される。これはボストロムの「先発した超知能が世界の唯一の意思決定主体になる」という命題に対する、フェーズGなりの回答である。「単一の超知能が世界を統べる」筋書きは、フェーズEからFにかけて分散する身体化が標準化したことで、構造的に成立しがたくなった。代わりに、多様な知性の編成体系が、それぞれの場での主導権を交替しながら共存する状態が定常解として固定される。
素材の領域では、量子計算・古典計算・生物計算の3層化が完成する。フィジカルAIは最適な計算リソースを動的に選択する。事業はフロー型からストック型へ完全に移行する。身体の領域では、人間-ロボット-AI-環境の融合システムが日常インフラとなる。物理世界とサイバー空間が連続体として運用される。生命の領域では、機械の改良を超えて「生命と機械と人間の協働体制」を実装する。文明維持インフラ──食糧生産、廃棄物循環、気候制御──の主要担い手として、生命系製造が定着する。
認知の領域では、ヴァレラ・トンプソン・ロッシュが1991年に発表した『身体化された心』が論じた「知性は単一の場所には存在しない」という構図の工学的実現が完成する。1つのタスクには複数の認知システム──環境モデル、身体スキーマ、社会的推論、言語理解、予測符号化、自由エネルギー最小化──が並行して関与し、それぞれが状況に応じて主導権を交替する。人間の脳もまた、このオーケストラの1つの楽器として参加する。京都の臨床心理学者である河合隼雄(1928-2007)が深く読み込んだ世界の神話・民話の構造が、フェーズGのAI倫理教育の参照点として制度化される。河合は「神話は人類が機械的対象と関係を結ぶ作法を、文化を超えて蓄積してきた集合的記憶である」と語ったが、その語りがフェーズGの制度設計のなかで字義通り運用される。
フェーズGの主要な節目としては、2095年の関係論的存在論の制度中核原理化、2098年の「知性の多様性」概念の認識(生物多様性に類比される)、2100年のフィジカルAIの境界溶解点到達が並ぶ。重要なのは、2100年が「フィジカルAIの完成点」ではなく、「フィジカルAIが他のAI形態と区別不能になる『境界溶解点』」として到達されることである。これは終着ではなく、次の1000年へ向けた基盤の確立である。神話の層からみれば、フェーズGは『フランケンシュタイン』『ロッスム万能ロボット会社』『2001年宇宙の旅』が描いた西洋型「造物主の傲りと反逆する人造身体」神話と、『鉄腕アトム』『攻殻機動隊』が描いた東洋型「魂を持つ機械を家族として迎える/魂と殻の融合」神話が、世界規模で和解する時期にあたる。中沢新一(1950-)が1970年代から論じてきた「対称性人類学」── 近代が捨象した動物・植物・霊・機械との対称的関係を、人類学の知見から再構築する試み──が、フェーズGの倫理規格の参照点として国際標準に組み込まれる。
2100年へのまなざし ── 「人類の役割」の再定義と次の1000年への入口
フェーズEからGを貫く構造的な特徴を、最後に整理しておく。第1に、素材系統が40年間にわたって律速の要因であり続ける一方で、フェーズE末からフェーズFにかけて核融合・宇宙太陽光発電・量子計算機の3つが商用稼働することで、初めてこの律速が緩和される。エネルギーと計算の両方が「希少資源」であることをやめる時期である。
第2に、認知系統が目標設定の役割を担い続ける。何が最適化の対象か、何を知性と呼ぶか、人間とは何かという問いは、認知系統が定義する。これがフェーズE以降の文明的転換の理論的基盤となる。英国の神経科学者カール・フリストンの自由エネルギー原理、クラークの拡張認知、ヴァレラの身体化された認知、ハッチンスの分散認知の4系統が、40年かけて産業実装として浸透していく過程である。これに、西田の述語的論理、清水の場の理論、川人の内部モデル、河合の元型論、鶴見の内発的発展論、中沢の対称性人類学の6本が並列に参照され、東西の認知系統が対等な理論資源として運用される。
第3に、生命系統が境界溶解の物質的担い手となる。機械と生命の境界、計算と化学の境界、個体と環境の境界は、生命系統の進展に応じて物質的に書き換えられる。これは思想ではなく、柔らかいロボット、生体合成生物、人体由来の組織ロボット、生きている工場の連続的進展がもたらす物質的事実である。
第4に、5系統合流のモデルがフェーズD以降は8系統オーケストラへと完全に拡張される。フェーズCまでは5系統が中核だったが、フェーズD以降は生命・素材・認知の3系統が対等な参加者として加わる。これは3つの新しい系統の提案が、フェーズE-Gの構造的な必然性を持つことを示している。
第5に、前プロジェクトの4時点(2030/2050/2070/2100)はそれぞれフェーズA末・C中盤・E初期・G到達点に対応する。人材像の変化軌道とフィジカルAIの技術軌道が同期して進む。これは偶然ではなく、フィジカルAIが「労働の代替」「知性の補完」「身体の拡張」「関係の再編」という4つの順序で社会に浸透するためである。
2100年の人材像は「知性のオーケストラの一員として、独自の楽器(人間性)を奏でる者」となる。人間に固有な能力──意味づけ、関係構築、倫理判断、芸術的探究──が、汎用知能時代における人類の核となる。「人類の役割」が、文明維持から「意味の創造」「他者との関係性の深化」「未踏領域の探究」に集中する。これが本書が描く2100年文明像の到達点である。フィジカルAIは「終着点」を持たない。2100年は技術的完成点ではなく、フィジカルAIが他のAI形態・生命系・人間と区別不能になる「境界溶解点」である。これは次の1000年へ向けた新たな基盤の確立である。本書が描いた74年間は、人類が自分自身の役割を「労働する者」から「意味を編む者」へと再定義する過程として読まれるべきである。フィジカルAIはその過程の触媒であり、最終的にはその触媒自身が背景に溶けていく。それが、本書がたどり着く最終的な命題である。
フェーズE-Gの関係論的物質代謝 ── 5つの兆候
フェーズE-G(2060~2100年)の関係論的物質代謝は、5つの兆候として観察される。第1の兆候は製造の生命系化である。生体機械複合のロボットが日用品レベルで使用され、「修理」ではなく「再生」される製品系統の登場が見られる。第2の兆候は都市の身体化である。建物が自己修復し、都市インフラが新陳代謝する。菌糸体ベースの建材を用いた「生きている建築」が標準化する。第3の兆候は農業の対話化である。植物基盤モデルにより植物との対話が日常化し、農作業が「収穫」から「協働」へ移行する。第4の兆候は医療の関係化である。健康管理がケア・チームによる関係性の労働として再定義され、病気の概念が「個体の異常」から「関係の不全」へ移る。第5の兆候は教育の同席化である。知識伝達ではなく、人間・AI・自然・将来世代が1つの「同席の場」として教室を構成する。これら5つの兆候は2070年代から2090年代に顕在化し、2100年の関係論的物理生態系の輪郭を構成する。
フェーズGの境界溶解点 ── 4つの溶解
フェーズG(2090~2100年)の「境界溶解点」は、4つの境界の同時溶解として実現される。第1に機械と生命の溶解。生体機械複合のロボットによって、機械と生命の区別が物理的に曖昧化する。第2に人間と非人間の溶解。関係論的存在論の制度化により、人間と動植物・AI・自然主体の権利関係が対称化する。第3に個体と環境の溶解。分散する身体化により、個体の境界が環境と相互浸透する。第4に現在と未来の溶解。将来世代の代表が組織の意思決定に参加することで、時間軸の境界が制度的に溶解する。これら4つの溶解は2100年に到達点ではなく出発点として位置づけられる。次の1000年への基盤として。
フェーズE-Gを支える6つの周辺基盤
フェーズE-Gの実現は、6つの周辺基盤に依存する。第1にエネルギー基盤。核融合・常温超伝導・宇宙太陽光発電の実装でエネルギーコストが物理的限界に達する。第2に規制基盤。AIの法的人格規範・地球の権利法典・宇宙経済法の国際統一が必須となる。第3に倫理基盤。関係論的存在論の制度化、自然権法理の地球規模化が進む。第4に教育基盤。関係論的教育の世代横断実装、生涯学習の国家インフラ化が必要となる。第5にデータ基盤。太陽系の惑星間通信網、月軌道・火星軌道のデータセンターが整う。第6に文化基盤。関係論的存在論を支える文化的合意の形成が問われる。これら6基盤のいずれかの遅延が、フェーズE-Gの到達時期を5年から10年単位で後退させる。
第7章
製造・医療・農業の組み換え
「物をつくる」「身体を治す」「植物を育てる」── 人類が10000年にわたって繰り返してきた3つの動詞は、フィジカルAIによって同じ方向へ書き換えられていく。すなわち、対象を支配し、効率化するという20世紀型の動詞から、対象と関係を結び、共に育てるという関係論的な動詞へ。これは技術的進歩であると同時に、人類が物質代謝と関わる仕方そのものの組み換えである。
第3部の冒頭となる本章では、フィジカルAIが波及する6分野のうち、いわゆる「一次・二次・健康」と呼ばれる基底的領域 ── 製造、医療、農業 ── を取り上げる。これら3領域は、いずれも人類の生存条件に直結し、いずれも20世紀型の機械パラダイムによって深く規定されてきた。製造は流れ作業ライン、医療は専門分化、農業は機械化と化学投入。フィジカルAIはこの3領域に対して同じ周波数で介入し、2030年から2100年にかけて段階的に動詞を組み換える。本章はその軌道を、各分野ごとに4時点(2030・2050・2070・2100年)で描き、共通する転換軸を末尾で抽出する。
製造業 ── 「統制する」から「育てる」、そして「譜面を書く」へ
製造業はフィジカルAIの最初の野戦場である。世界の産業用ロボット稼働台数は2023年末で4420000台、年間出荷540000台に達し(国際ロボット連盟 World ロボティクス 2024)、フィジカルAIが既存の自動化資産と直接接続して進展しうる唯一の領域である。製造業の動詞は250年にわたって「作る → 量産する → 改善する → 統合する → 統制する」と推移してきたが、フィジカルAIはこの系譜に「育てる」「譜面を書く」という新しい動詞を加える。
2030年の到達点は、Vision-Language-Action(VLA)基盤モデルの標準化である。Brohan et al. (2023, RT-2) からKim et al. (2024, OpenVLA) を経て、Open X-Embodiment(Padalkar et al. 2023, 22機種五二七スキル160万エピソード)が事実上の業界標準データセットとして定着した延長線上で、1000億パラメータ規模・1000万デモ訓練のVLAがデファクト化する。これによりロボットセル設計のリードタイムは現行の六─10二か月から二─四週間へと短縮する。Lee, Bagheri & Kao (2015) が予告したサイバーフィジカルシステムの知能層が、ファインチューニング可能な基盤モデルとして提供されるためである。同時に、Boston Dynamics Atlas Electric、Figure 02、アプトロニク社 アポロ、米テスラ Optimus V3、Unitree H1/G1 が示すヒューマノイドが、構造化作業領域での人件費競合点を突破する。米ゴールドマン・サックス(2024)の中央値で実効時給一〇─一五ドル、米国倉庫労働平均一九ドル毎時(BLS 2024)と比較可能な水準に到達する。
2050年は、製造の動詞が「統制する」から「育てる」へ完全に移行する時期である。AGI到達予測の中央値(人工知能 Impacts 2047 HLMI median)と整合するこの時期、非構造環境ロボティクスが標準化し、建設現場・農業・林業・災害現場・洋上施設といった「設計図のない物理空間」でロボットが自律稼働する。Karl Friston系のActive Inference(Lanillos et al. 2021)とDreamer V3(Hafner et al. 2024)的World Modelが統合され、製造現場のロボットは「予測誤差を最小化する自己生成エージェント」として動作する。製品ラインそのものが市場フィードバックで自己進化し、サプライチェーン全体がデジタルツインとして双方向ループで「育てられる」。Acemoglu & Restrepo (2020) が示した「ロボット導入1台あたり雇用六・6人減」のトレンドは、ヒューマノイド普及によって質的に変容し、先進国の製造業従業員は2024年比五〇─60%減少する一方、生産量は1.5─2倍に拡大する。
2070年、製造は「生命系製造期」に入る。Xenobot(Kriegman, Levin, Bongard 2020)・Anthrobot(Gumuskaya, Levin et al. 2023)系統の延長で、生体素材を組み込んだ自己組織化製造が実用段階に到達する。Wang & Urban (2020) の自己修復ポリマー、Brodin et al. (2015) の酵素的DNA組立、Boo, Khalil et al. (2024) のAI設計合成微生物群が統合され、製品は「製造される」のではなく「育つ」段階に入る。Swarm ロボティクス(Rubenstein et al. 2014)の延長で、生産現場は数千─数万の小型ロボットの群知能で運営される。製造業という従来カテゴリ自体が溶解し始め、製造・農業・廃棄物処理・エネルギー供給が1つの「物質代謝管理産業」として再編される。
2100年、製造業は雇用統計上のカテゴリとしてはほぼ消滅する。フィジカルAIは単一の知性ではなく「知性のオーケストラ」として機能し、製造業はその物理層を担う。人間に残されるのは、目的論・倫理・美的判断を担う「譜面を書く者」と、人間─AI協働のなかで身体的・関係的価値を生む「楽団員として座る者」の二種の役割である。製造業の従業員規模は2024年比95%以上減少するが、生産量と多様性は数桁拡大する。製造業は終焉するのではなく、250年にわたって「人類の物質代謝の中心」であった時代の終わりと、新しい関係論的物質代謝の時代の始まりが、ここで重なる。
医療・介護 ── ケア労働の非対称分業
医療・介護は、フィジカルAIの波及が「効率化の選択肢」ではなく「人口構造的必要」として迫られる領域である。日本の高齢化率は2025年に三0.0%、OECD推計では2050年に三7.7%に達する(経済協力開発機構 Health Statistics 2024)。介護人材不足は技術導入の選択肢ではなく、社会維持の必須条件として迫る。同時に、ケア労働は完全代替されない。「触れる、聞く、見つめ続ける、共在する」という関係性労働は人間に残り、AIと機械は周辺労働(記録・調整・見守り・薬剤管理・移乗)を引き受けるという非対称な分業が、4時点を貫く構造軸となる。
2030年は、AI診断の標準化とAlphaFold系創薬の本格運用の年である。皮膚科のEsteva et al. (2017)、眼科のGulshan et al. (2016)、放射線科のMcKinney et al. (2020) を経て、Liu & Faes et al. (2019) のメタアナリシスが示した「専門医同等水準」が制度化される。FDA承認AI医療機器は2024年時点で950を超え、2030年には電子カルテへの埋め込みが標準化する。AlphaFold 2(Jumper et al. 2021)・AlphaFold 3(Abramson et al. 2024)の登場で構造ベース創薬の前臨床段階は計算化され、Insilico MedicineのRentosertib(旧INS018_055)はAIが標的同定からリード設計まで担った最初のフェーズII到達薬として報告された。介護では、サイバーダイン社 補助スーツ、Toyota Human Support ロボット、汎用ヒューマノイド(アプトロニク社 アポロ、Figure 02、Unitree G1)の波及で、移乗介助・夜間見守りが現場導入の臨界点に達する。
2050年は、AGI共同診療と介護ロボ標準装備の時代である。Med-PaLM 2、GPT-4系医療派生、Microsoft Nuance DAXの延長として、診療プロセス全体(病歴聴取・身体所見統合・鑑別診断・治療計画・予後予測)がAGIと医師の共同意思決定に再編される。Beam & Kohane (2018) の予測が25年の臨床蓄積を経て制度化される。合成生物医療では、Boo, Khalil et al. (2024) で実証されたAI設計微生物群の延長で、腸内細菌叢設計・経口バイオ医薬・人工臓器のAI設計が研究室から臨床へ移行する。Sinclair系(Yang, Hayano, Sinclair et al. 2023)のエピジェネティック・リプログラミングが選択的介入として臨床到達範囲に入る。日本・ドイツ・韓国の介護施設では、移乗・排泄・入浴の三大重労働が機械化され、介護報酬体系がロボット導入を前提とする再設計を経る。ここで決定的なのは、介護ロボが置き換えるのは「重労働」であり、関係性労働は人間に残るという制度設計である。Sharkey & Sharkey (2012) が早期に警告した「人間との接触の代替」シナリオは、2050年の制度設計で明示的に避けられる。
2070年、診断・治療・予防の境界が溶解する。連続的生体モニタリングとAI動的予測が「異常検出と介入」を秒単位で結合し、再生医療は「生体組織を再生する」段階から「機能不全臓器を生体素材で置換する」段階へ移行する。Morimoto, Takeuchi et al. (2018) のBio-Hybrid技術が人工心臓・人工膵島・人工腎臓の生体素材化を可能にする。Neuralink・Synchron・Paradromics系の侵襲型BMIが、軽度認知障害から中等度認知症の患者で記憶補助・空間定位支援・人物認識補助として制度化される。Active Inference系理論(Friston 2010、Pezzulo, Parr, Friston 2022)が脳─機械─環境ループの設計原理として臨床で参照される。ケア労働の構造は、移乗・排泄・入浴・薬剤管理・記録・見守りはフィジカルAIが担い、診断補助・治療計画立案は AGI共同診療が担い、「触れる、聞く、見つめ続ける、共在する」関係性労働だけが人間に残るという完全な非対称分業として確立する。
2100年、健康寿命100歳が先進国の中央値として成立する。WHO平均寿命統計の1950─2020年の延伸(46歳→73歳、約27歳)から、技術蓄積による次の80年で一〇─25歳の延伸は線形外挿の中央値範囲にある。医療の中心は「治療」から「予防+関係性ケア」へ完全に移行する。侵襲型BMIによる認知拡張、生体組織置換、人工オルガノイドによる臓器交換が選択的医療として確立し、「治療」と「拡張」の境界が制度的に再定義を迫られる。Beauchamp & Childress『生命医学倫理の諸原則』の四原則(自律・無危害・善行・公正)に、第5の原則として「関係性の維持」が追加される。
農業・食料・植物連携 ── 「植物との対話」へ向かう4時点
農業は人類最古の物質代謝過程であり、現在も世界GDPの約4%、雇用の約26%(World Bank 2023)、温室効果ガス排出の約23%(IPCC AR6 WG3 2022)、淡水使用の約70%(FAO AQUASTAT 2024)を占める巨大領域である。フィジカルAIの波及はこの領域を、機械化(20世紀型)でも遺伝子改変(20世紀末─21世紀型)でもない第3の道 ── 「植物と機械と人間の協働」── へ向かわせる。
2030年、フィジカルAIは農業の3層(圃場・温室・垂直農場)すべてに浸透する。John DeereのSee & Spray Ultimate(2023年商用化、Blue River TechnologyのEdgeAI実装で除草剤使用量平均66%削減)、Planet Labsの200機超のDove衛星群、DJI Agras T50、Yamaha RMAXが農業生産統計を「植物個体ベース」のリアルタイムデータへと再構成する。培養肉では、UPSIDE FoodsとGOOD Meatが2023年6月にUSDA/FDA共同承認を取得し、シンガポール(2020)・イスラエル(2024)に続いた。Solar FoodsのSolein(空気・水・電気から微生物発酵で生産する単細胞タンパク質)はフィンランドで2024年商用工場を稼働させた。植物電気生理─AI連携では、Vivent SAのPhytlSignがCocozza et al. (2024) のLSTMで植物電気信号から灌水ニーズを91%精度で予測する技術を商用化した。Pivot Bioの窒素固定菌は2024年米国コーンベルトで100万エーカー超に展開され、化学肥料依存からの構造的離脱が始まる。
2050年、農業の構造的再編が完成に向かう。FAO『The future of food and agriculture』(2024更新版)が示すように、世界人口九〇─95億・気候変動進行下で従来型農業だけでは食料供給が成立しない。培養肉が世界畜産タンパク質の二〇─30%、Precision Fermentation由来タンパク質(Solein型・乳タンパク・卵タンパク)が一〇─15%を占める可能性が高い(Tubb & Seba 2019、Good Food Institute 2024 State of the Industry Reportの延長軌道)。AlphaFold 3後継 × CRISPRの組み合わせで、Voytas LabのDe Novo Domestication(野生種から数世代で栽培化、Fernie & Yan 2019)が複数作物で実装され、C4化米・低水分小麦・耐塩性トマトが品種登録に到達する。AI設計微生物群がカーボン農業(土壌炭素固定)の中核技術となり、Bossio et al. (2020) が推計した土壌炭素ポテンシャル(年間2.3─5.3GtCO2)の半分以上をAI支援農業が担う。植物の電気信号・揮発性有機化合物放出・根圏微生物コミュニケーションを統合解析する「Plant Foundation Model」が研究投資を受け始める。
2070年は「生命系製造期」の到来である。圃場作業の99%以上がロボットと自律機械で実行され、人間労働は意思決定・倫理判断・地域コミュニティとの調整に集中する。培養肉・Precision Fermentation・藻類タンパク・昆虫タンパクが世界タンパク質供給の50%以上を占め、従来畜産は高級品・文化的食品・地域コミュニティ食品として残存する。植物─AI連携農業が制度化され、農業企業の経営原理に「植物との対話品質」が組み込まれる。ESG指標に類似した「Plant Communication Score」が登場し、投資家・規制当局・消費者が監視する。植物電気生理シグナル→AI意思決定→アクチュエータ介入のループが、人間の介入なしに圃場・温室・垂直農場で常時動作する。Calvo, Sahi & Trewavas (2020) が提起した植物の感受性問題は、技術的実装上の問題に転化する。
2100年、「植物との対話」が農業の前提条件となる。Phytomorphological computing(植物形態の計算的利用)、植物─機械対話プロトコル、植物シグナル翻訳AIが、農業企業の標準ツールとなる。圃場・温室・垂直農場・宇宙農業(月面・火星・軌道上)・海中農業が並列存在し、それぞれにフィジカルAI基盤が組み込まれる。Willett et al. (2019) のEAT-Lancet「プラネタリーヘルス・ダイエット」が技術的に実現可能な選択肢として広く採用される。テ・アワ・トゥプア法(ニュージーランド2017)、エクアドル憲法(2008改正、第71─七十四条で自然権を規定)、ボリビア母なる地球法(2010)の系譜が国際標準として制度化され、農業企業は生態系を「契約相手」として扱う実務に従事する。
3領域を貫く転換軸 ── 関係論的物質代謝へ
3領域に共通する4つの転換軸
製造・医療・農業の3領域は、表層的には大きく異なる対象(金属と樹脂、人体、植物と微生物)を扱う。しかしフィジカルAIによる2030─2100年の組み換えは、4つの共通軸を持つ。
第1に、動詞の組み換え。製造は「統制する」から「育てる」へ、医療は「治療する」から「予防し関係を維持する」へ、農業は「収穫する」から「対話する」へ。いずれも、対象を一方的に操作する動詞から、対象と関係を結ぶ動詞へ移行する。
第2に、人間役割の2極化。3領域いずれも、人間労働は「譜面を書く」(目的設計・倫理判断・関係性労働)と「楽団員として座る」(身体的・経験的・地域固有の価値生成)の二種に集約される。中間労働(標準化された手順実行)はフィジカルAIに委譲される。
第3に、カテゴリの溶解。製造業は「物質代謝管理産業」へ、医療は「予防+関係性ケア」へ、農業は「植物・微生物・生態系との協働」へ。それぞれ20世紀の産業カテゴリの輪郭が溶解し、領域横断的な物質代謝管理として再編される。
第4に、時間軸の連続性。3領域いずれも、2030年(基盤モデル標準化)・2050年(生命系統合)・2070年(自己組織化)・2100年(関係論的運営)という同じテンポで段階的に動詞が組み換えられる。これは偶然ではなく、5系統の合流速度が3領域に共通の周波数として現れていることを意味する。
3領域を貫く深層構造は、人類が物質代謝と関わる仕方の組み換えである。製造業が250年にわたって担ってきた「物質を人間の意図に従わせる」というパラダイムも、医療が200年にわたって発展させてきた「身体を機械として修理する」というパラダイムも、農業が10000年にわたって精錬してきた「植物を収量最大化のために制御する」というパラダイムも、いずれもフィジカルAIが介入する80年のあいだに、関係論的な物質代謝へと組み換えられていく。これは技術ロードマップの問題であると同時に、人類が地球システムと結ぶ関係そのものの再交渉である。
3領域の規制成熟度 ── EU/米/中の3極構造
製造・医療・農業の3領域における規制成熟度は、EU・米・中の3極で大きく異なる。EUは2024年8月発効のAI Act Article 6で人事・医療AIを高リスク分類し、製造AIにも適合性評価を要求。MDR(医療機器規則)2017/745と統合され、医療AIの欧州市場参入は最も厳格。CAP(共通農業政策)2023-2027は精密農業AIの環境影響評価を義務化。米国はFDA SaMD(Software as a Medical Device)ガイダンス(2017〜)で医療AIを規制、製造AIはOSHA安全基準と業界自主規制の組み合わせ、農業AIはUSDA・EPAの分散規制。中国は2023年「生成AI管理弁法」で生成AIを規制、医療AIはNMPA(国家薬品監督管理局)が承認、製造AIは「中国製造2025」枠組みで国家戦略化、農業AIは「智慧農業」政策で補助金優遇。3極の制度競争が、フィジカルAIの2030-2050年の市場形成を方向づける。
3領域の人材構造変化 ── 譜面を書く者と楽団員
製造・医療・農業の3領域で、人間労働は「譜面を書く者」(目的設計・倫理判断・関係性労働)と「楽団員」(身体的・経験的・地域固有の価値生成)の2極へ集約される。製造では、譜面を書く者は工程設計者・関係的ファシリテーター、楽団員は熟練技能者・地域職人。医療では、譜面を書く者は医療ケア・チーム編成者・倫理判断者、楽団員はケアワーカー・看取りの専門家・身体的支援者。農業では、譜面を書く者は植物-AI対話設計者・地域生態系管理者、楽団員は地域知の継承者・自然権主体の代弁者。中間労働(標準化された手順実行)はフィジカルAIに委譲される。3領域共通で、2050年までに全労働の40-50%が2極化し、中間労働は10-15%に縮小する見込み。
3領域の地政学的不均衡
3領域のフィジカルAI実装は、グローバルに不均衡である。製造はドイツ・日本・韓国・台湾・中国が先行、東南アジアが追随、アフリカ・ラテンアメリカは遅延。医療は米国・EU・イスラエル・シンガポールが先行、中国が独自展開、新興国は遠隔医療経由で部分実装。農業は米国・オランダ・イスラエル・オーストラリアが精密農業で先行、中国が大規模実装、アフリカ・ラテンアメリカ・南アジアは独自の小規模実装と国際援助の混合。この地政学的不均衡は、2030-2050年の世界貿易構造・食料安全保障・移民パターンを規定する。EU CBAM(炭素国境調整メカニズム)2026年本格適用は、フィジカルAI生産製品の国際取引に新たな摩擦を生む。
第8章
都市・宇宙・教育の組み換え
「住む」「広がる」「育つ」── 人類が空間と時間に対して持つ3つの動詞は、フィジカルAIによって相互に深く絡み合う。都市は身体を持ち、宇宙は人類圏の延長となり、教室は同席の場となる。これは別々の領域での変化ではなく、人類が空間と時間に介入する仕方そのものの再編である。
本章は第7章に続く第3部後半として、フィジカルAIが波及する6分野のうち、空間・時間・人材育成に関わる3領域 ── 都市、宇宙、教育 ── を取り上げる。これら3領域は、製造・医療・農業のような直接的な物質代謝とは異なる位相にあるが、いずれもフィジカルAIが「人類の活動範囲を組み換える」という共通の方向で介入する。都市は人類の居住空間、宇宙は活動空間の拡張、教育は次世代の活動主体の育成 ── この3つを通じて、フィジカルAIは人類圏(anthroposphere)そのものの輪郭を書き換えていく。
都市・モビリティ ── 機能分離都市から関係論的都市へ
都市と機械の関係は、Ebenezer Howard『Garden Cities of To-Morrow』(1898)、Le Corbusier『Urbanisme』(1925)以来、機能分離と自動車中心の設計思想によって規定されてきた。Jane Jacobs『The Death and Life of Great American Cities』(1961)は、歩行者中心・混合用途・近隣関係論の反論として、現代の Walkable City、Carlos Moreno(Sorbonne 2016)の 15-Minute City 議論の系譜の出発点となった。フィジカルAIは、この1世紀続いた都市思想の対立に対して、関係論的都市の側に決定的な物質的・技術的基盤を提供する。
2030年、自動運転Lv4が主要都市で標準サービスとなり、Lv5が1部地域で実証される。米ウェイモ Oneは2024年末でPhoenix・San Francisco・Los Angeles・Austinの四都市で週200回超の乗車を達成し、米テスラ Robotaxiは2025年6月にAustin限定でLv4サービスを開始、中国ではアポロ・ゴー・中国ポニーAI・中国ウィーライドが武漢・北京・深圳・広州で日次数1000回運行する。世界のLv4タクシー稼働台数は累計500000台規模に達する見込み(米ゴールドマン・サックス Mobility 2024)。eVTOLは商業観光・空港シャトル・救急医療搬送で実用化し、米ジョビー・米アーチャー・中国 EHang EH216-S(CAAC2023年世界初の自律eVTOL型式証明取得)が各極で先行する。都市OSは、国土交通省 プラトー計画・仮想シンガポール基盤・Helsinki Kalasatama Digital Twinの系譜が世界一〇〇都市以上に拡大する。建築面では、米アイコン社(Austin, Texas)が2024年にWolf Ranchコミュニティ一〇〇戸の3Dプリント住宅量産を達成し、オートデスク社 フォルマ系譜の生成的都市計画AIが標準採用される。
2050年、Stream 2が予測したヒューマノイドの非構造環境人間並み達成が都市生活に統合される。建設・補修・清掃・配送・介護・店舗業務の三〇─40%(米マッキンゼー 2024)がヒューマノイドに代替され、エレベータ・歩道・店舗の動線設計が「人間+ヒューマノイド共存」前提で更新される。地上の自動運転Lv5が完全普及し、自家用車所有率は先進国都市部で30%以下に低下、eVTOLの世界Vertiportは数1000箇所・年間離着陸数は数10000回規模に達する。都市は「自己適応化」のフェーズに入り、Henk Jonkers(TU Delft 2010)のバクテリア型自己修復コンクリート、Skylar Tibbits(MIT 2013)の4Dプリンティング、形状記憶ポリマー・光誘起ポリマー再結合の三技術系譜の合流として「Self-Healing Infrastructure」が実装される。
2070年、都市は「生態系との統合」段階に入る。建材としての生体素材(菌糸体ベース、Ecovative系譜、藻類由来BioMASONコンクリート、CO2固定セメントSolidia/Carbicrete系譜)が主流化し、都市そのものが大気中CO2を固定する炭素シンクとなる。Pickett et al. (2021) 系譜の都市生態学が、Stream 4のAI設計材料と統合され、生態系工学(Ecosystem Engineering)が都市計画の中核に位置づけられる。eVTOLは通勤・物流の主要モードとなり、Boeing/Airbusの従来航空機メーカーはeVTOL・eSTOL領域に主軸を移す。特筆すべきは月面都市の初期形成である。Artemis計画(米航空宇宙局 2024─)の延長で2070年には月面恒久基地が運用段階に達し、ICONがNASA/DARPAとのProject Olympus(月面3Dプリント住宅構想、2022年契約)の延長線で月面建築を実施する。
2100年、Christopher Alexander が『A Pattern Language』(1977)で描いた「都市は生きている」という命題が、文字通りの意味で実装される。都市は単なる物理インフラの集積ではなく、複数の知性(人間の集合知・AIシステム群・都市生態系・センサー網)が協調する「知性のオーケストラ」の物理身体として位置づけられる。Stream 4の核融合・宇宙太陽光発電・高効率蓄電・AI設計触媒の組み合わせで、エネルギー希少性が消える。廃棄物は分子レベルで分解・再構成され、都市は実質的に「外部から物質を取り込まず、外部に廃棄しない」閉鎖系として運用される。Le Corbusier 的な機能分離都市から Jane Jacobs 的な関係論的都市への完全転換が、フィジカルAIを媒介として2100年に達成される。
宇宙開発・極限環境 ── 通信遅延下の自律判断と人類圏の拡張
フィジカルAIが切り拓く最も峻烈な波及分野は、人間が直接立ち会えない場所 ── 宇宙空間・深海・極地・放射線環境・火山・災害現場である。これらの極限環境は、5系統の集成的応用が文字通り「生存条件」となる領域であり、人類圏(anthroposphere)そのものを拡張していく。Stream 2の「2070年:月面・火星でのロボット先行進出」とStream 5の「Active Inference / World Modelによる自律判断」は、宇宙・極限環境において結節する。
2030年、地球低軌道(LEO)はNASA主導のISS退役(2031年予定)と並行して、Axiom Station・Vast Haven-2・Blue Origin Orbital Reef・Starlabの四─6基の商業宇宙ステーションが分散運用される。これらすべてが軌道上組立・補修・実験操作にフィジカルAIを採用する。米航空宇宙局 Artemis III/IV、CNSA国際月研究ステーション(ILRS)、宇宙航空研究開発機構 LUPEX(インドISROとの共同月極域探査)が並行進行する。商業宇宙経済の規模は米マッキンゼー「Space: The $1.8 trillion opportunity」(2024年4月)によれば、2035年までに一・8兆ドル規模に達する。深海ではWoods Hole AUV Sentry、JAMSTECの「うらしま」、Saildrone Surveyorが太平洋・大西洋全域の自律観測網を構築する。
2050年、宇宙開発は「人類の常住空間」への決定的拡張を遂げる。月面ではNASA Artemis BaseCamp・CNSA月面研究基地・ESA Moon Village構想が部分統合され、月南極周辺に累計100名規模の常駐人員が交代制で滞在する。ESA PAVERプロジェクトが2024年に技術実証完了した月面レゴリス3Dプリント建材が標準化され、月極域の水氷からの水・水素・酸素抽出(ISRU)が産業基盤となる。火星有人ミッションは、米スペースX Starship・米航空宇宙局 Mars Exploration Architecture・CNSA天問シリーズが複数経路で進行し、2040年代後半に複数の有人到達が現実化する公算が高い。火星表面では、人間1名に対しフィジカルAIロボット五─10台が「労働編成」を構成し、地球─火星片道通信遅延四─24分の制約下でロボットは戦術判断を自律化する。軌道製造はVarda Space Industries・Sierra Space・Made In Spaceが商業化を達成し、Caltech SSPP(Atwater・Hajimiri主導)が2023年6月にMAPLE実験で世界初成功した宇宙太陽光発電(SBSP)は、宇宙航空研究開発機構 SSPSとともに2030─2040年代に実用化する。
2070年、月面では1000─10000名規模の半永住人口が分散都市網を形成し、月面は単1国家の専有空間ではなく多国籍・多事業者の共有空間として運用される。これは宇宙条約(1967)・月協定(1979)・Artemis Accords(2020、2024年5月時点で42カ国署名)の枠組み拡張の結果である。小惑星資源採掘はNASA OSIRIS-REx(2023年9月Bennuサンプル地球帰還)、JAXAはやぶさ2拡張ミッション、AstroForge・Karman+が技術蓄積を進め、近地球小惑星からの白金族金属・水・希土類元素の経済的採掘が成立する。ISRUは第2世代へ進化し、月レゴリスからのチタン・アルミニウム抽出、火星大気CO2からのメタン燃料合成(米航空宇宙局 MOXIE後継)、月極域水氷からの水素ロケット燃料生産が標準化され、地球からの補給依存は10%以下に圧縮される。
2100年、月面常駐人口は100000人規模に達し、火星には数1000人規模の科学・探検・産業拠点が成立する。フィジカルAIは月・火星・小惑星・木星圏・土星圏への深宇宙自律探査を主導する。木星─地球通信遅延は片道三十五─50分、土星─地球は片道七〇─90分に達するため、人間の逐次操作は物理的に不可能であり、Active Inference/World Model基盤のロボット群が「ミッション目的と倫理制約のみ与えられた」状態で自律判断を行う体制が標準化される。米航空宇宙局 Europa Clipper(2024年10月打ち上げ)、ESA JUICE(2023年4月打ち上げ)、米航空宇宙局 Dragonfly(2028年6月打ち上げ予定)の後継として、エンセラドス氷殻貫通プローブ、タイタン湖沼自律潜水機が打ち上げられる。Karl Friston系のActive InferenceとDavid Ha系のWorld Modelsを統合した「Embodied Foundation Model for Deep Space」が成立する。Outer Space Treaty(1967)が掲げた「全人類の領域」原則とArtemis Accordsが現代化した原則の延長線上で、月・火星・小惑星における先住権・労働権・市民権・財産権・環境保護権の体系が再構築され、Tony Milligan・Konrad Szocikらの宇宙倫理学(『The Ethics of Space Exploration』Springer 2016)の蓄積が国際法として制度化される。フィジカルAIは「人間が直接立ち会えない場所で人間の代理判断を行う」存在として、倫理判断の主体性の1部を担う。
教育・人材育成 ── 譜面を書く者を育てる教室へ
フィジカルAIが技術系統として成熟するとき、それは産業構造を書き換えるだけでなく、教室そのものを書き換える。教育の領域では、2024─2026年に3つの萌芽が同時発火した。第1にKhan AcademyのKhanmigo(2023年3月公開、GPT-4基盤)が65学区で正式運用され、Vanderbilt大学Kestin et al. (2024) はハーバード大物理学クラスでAIチューター群が能動学習群を学習効果量 d=1.21 で上回ったことを報告した。第2にBelpaeme et al. (2018) 以降のSocial ロボット Tutor研究が、SoftBank NAO・Pepper・Furhat Roboticsの対話ロボットを使った数100人規模のRCTを蓄積した。第3にMakransky & Petersen (2021) がVR/AR没入学習の認知モデルを確立した。これら3つはStream 1・Stream 2・Stream 4の応用だが、2026年時点では依然「ツール」として教室に置かれているにすぎない。
2030年、OECD諸国の中学校で生徒1人に少なくとも1つのAIチューターが標準装備される。これはPCやタブレットが2010年代後半に標準化した経路と同じ速度である。Holstein et al. (2019) が描いた「教師─AI協働ダッシュボード」が普通の教室の備品となる。日本の学習指導要領は2032年改訂で「情報I」枠を「情報I・II+AI倫理」へ拡張する見通しで、これがフィジカルAIを扱う最初の制度的足場となる。探究学習は2030年にはフィジカルAIの介在によって「データ駆動探究」が標準モードになり、生徒は問いを立て、AIに文献を網羅させ、ロボットセンサで現場データを取り、機械学習で仮説を検証するサイクルを中学段階で経験する。
2050年、教室の構成要素は人間の教師・生徒・AIチューター・ロボット教師・没入学習空間の5項目となる。Belpaeme et al.(2018)が予見した「ロボット教師は人間教師を置き換えるのではなく補完する」が制度として実装され、2人三脚(人間教師+人工知能/ロボット教師)が学校現場の基本単位となる。生徒─AI関係は対称化し、Andy Clark の拡張認知が中学校教室で前提となる。生徒はAIを「考えるための関係の網」として扱い、Edwin Hutchins『Cognition in the Wild』(1995)の分散認知が学校教育の標準モデルとなる。非侵襲BMI(EEG+fNIRS)が一般生徒向けに普及し、Davidesco et al. (2021) が示した「教師と生徒の脳活動同期が記憶定着を予測する」発見が教室での実時間モニタリングの根拠となる。教師の役割は「知識伝達者」から離れ、「学習の譜面を書く者」「複数知性の同席を整える者」へ移る。Russell『Human Compatible』(Viking 2019)の整合性問題が教育課程の中核に入り、「AIを止める判断のしかた」が中学校から扱われる。
2070年、侵襲型BMIが選択的拡張デバイスとして高等教育に組み込まれる。これは強制ではなく自己選択の領域だが、医学・複雑系科学・宇宙工学といった高密度認知が要求される分野ではBMI補助が事実上のスタンダードとなる。Neuralink・Synchron・Paradromics系の高密度BMIが2030年代に商業化を経て、2050年代に医療補助を超えた選択的拡張として一般化し、2070年に高等教育で「教育的BMI」が制度化される経路である。これは「惑星システム読解力」── 地球システム科学・気候モデル・生態系の複雑性を1人の人間が直観的に把握する能力 ── の実装基盤となる。世代を超えた継承の制度化も2070年の重要変容である。教師個人ではなく「世代横断のメンタリング・ネットワーク」が学習の単位となり、人間・人工知能・ロボット・自然・微生物・将来世代といった異なる存在のあいだで意思決定を調停する技法が、同席の場での経験を通じて獲得される。
2100年、教育の最終形態は「同席としての育成」である。ミラツクの詳細な分析結果が描いた「同席」概念は、人間・人工知能・ロボット・自然観測ネットワーク・伝統知の運び手・地域共同体の代表が、対等な参加者として1つの卓を囲む構図を指す。2100年の教室は、この同席の縮図である。生徒は単一の教師から学ぶのではなく、複数の知性の同席に参加することで育つ。Francisco Varela が1991年に「知性は単一の場所には存在しない」と述べた構図の教育的実装である。Stream 5で描いた認知のオーケストラ化(World Model・Active Inference・身体スキーマ・社会的推論・予測符号化・自由エネルギー最小化)が並行して走る学習空間で、生徒は1つのタスクに対する複数の認知システムの主導権交替を体感する。育成の目標は「個人の能力を最大化する」から「複数知性の関係の網のなかで自分の音を出せる楽器となる」へ転換する。
3領域を貫く転換軸 ── 人類圏の輪郭の組み換え
空間・時間・人材育成を貫く4つの軸
都市・宇宙・教育の3領域は、それぞれ別個の社会基盤として発展してきた。しかしフィジカルAIによる2030─2100年の組み換えは、4つの共通軸を持つ。
第1に、身体性の拡張。都市は自己修復し新陳代謝する身体を持つようになり、宇宙ではフィジカルAIが人類の代理身体として機能し、教室では生徒─人工知能─ロボットの拡張身体が学習主体となる。3領域いずれも、人間身体の境界が技術によって拡張され、人間以外の存在が「身体の1部」として組み込まれる。
第2に、遅延と距離の媒介。都市の交通遅延、宇宙の通信遅延、教育の世代間遅延 ── いずれも、フィジカルAIが時間的・空間的距離を媒介することで、新しい関係様式が可能になる。火星でロボットが自律判断するように、教室では世代横断のメンタリング・ネットワークが時間を媒介する。
第3に、知性のオーケストラ化。都市OSは都市生態系・センサー網・人間集合知の協調体として、宇宙ミッションは人間・人工知能・ロボットの分散判断系として、教室は複数知性の同席として機能する。3領域いずれも、単一の中心知性ではなく、複数知性の関係の網として運営される。
第4に、倫理と制度の同時設計。Le Corbusier 対 Jane Jacobs の都市思想、Outer Space Treaty 対 Artemis Accords の宇宙倫理、知識伝達対同席育成の教育論 ── 3領域いずれも、技術設計と並行して倫理・制度の再設計が進行する。フィジカルAIの導入は技術問題ではなく、社会契約の更新を伴う。
都市・宇宙・教育の3領域を貫く深層構造は、人類圏(anthroposphere)の輪郭の組み換えである。20世紀前半に Pierre Teilhard de Chardin が「Noosphere」(知性圏)という概念で予感した(同概念は遺著『Le Phénomène Humain』1955年で展開)知性の地球規模の発展は、フィジカルAIの介入によって具体的な物質的・制度的形態を獲得する。都市が生きた身体として呼吸し、宇宙の極限環境で人類の代理判断者が動作し、教室で複数知性の同席が日常となるとき、人類圏は20世紀型の「人類による地球の支配空間」から、2100年型の「人類と複数知性が共在する関係の網」へと組み換えられる。Le Corbusier から Jane Jacobs へ、Outer Space Treaty から宇宙倫理の制度化へ、知識伝達から同席育成へ ── 3領域に共通する方向は、いずれも関係論的存在論の制度的実装である。
第7章と第8章で扱った6領域 ── 製造・医療・農業・都市・宇宙・教育 ── は、フィジカルAIの5系統合流が産業と社会基盤に流入する6つの主要な経路である。これらは独立して進行するわけではなく、相互に補強し合いながら同じ周波数で組み換えを進める。製造の関係論的物質代謝は、農業の植物との対話と接続し、医療の関係性ケアは、教育の同席と共鳴し、都市の自己修復インフラは、宇宙の自律判断ロボットと同じ技術系統を共有する。フィジカルAIの波及は、領域横断的な人類圏の総体的組み換えとして理解されなければならない。次章以降の第4部では、この組み換えが社会制度・労働・倫理・思想にもたらす変容を、より深く検討していく。
15分都市から関係論的都市へ
カルロス・モレノ(仏ソルボンヌ大学)の15分都市概念(2016年)は、徒歩・自転車で15分以内に生活必需機能(食料・医療・教育・労働・余暇)にアクセスできる都市設計である。フィジカルAIの実装により、15分都市は2030年代に世界主要都市50超で標準化され、2050年代に「関係論的都市」(relational city)へ進化する。関係論的都市は、人間・建物・植物・動物・微生物・機械が1つの関係網として運営される都市である。建物が自己修復し、植物が地域生態系の1部として参加し、動物が居住権を持ち、微生物が空気質と土壌健康を維持し、機械が代理判断者として動作する。Carlos Moreno → Patrick Sisson(建築理論)→ Mariana Mazzucato(ミッション・エコノミー)→ Bruno Latour(関係論的存在論)の系譜が、関係論的都市の理論基盤を構成する。
宇宙開発の3経路 ── Artemis vs Moon Treaty vs ILRS
宇宙開発の制度化は3経路に分裂している。Artemis Accords(米主導)は2020年成立、2025年5月時点56カ国署名。月資源利用の合法性、Safety Zonesの設定、宇宙廃棄物の責任管理を規定。Moon Treaty(1979年)は月資源を「人類共通財産」と規定し、商業利用を禁止。批准国18カ国(フランス・ベルギー・オーストリア・オランダ等のEU諸国含む)。ILRS(International Lunar Research Station、中露主導)は2021年構想発表、独自の月面基地計画を進める。3経路の競争は2030-2050年の月面定住・月資源採掘・月軌道経済を方向づける。フィジカルAI(自律ロボット・Bio-Hybrid Robot・Plant Foundation Model)の月面実装は、3経路のいずれを採用するかで実装形態が大きく異なる。
教育のオーケストラ化 ── 教室から同席の場へ
教育は「教える/学ぶ」の2項対立から、「同席する」関係的実践へ転換する。フィジカルAIの教育応用は3段階で進む。第1段階(2030年代)は個別最適化学習──Khan Academy 人工知能 Tutor・Coursera Coach・LinkedIn Learning AIが各学習者に適応した学習パスを提供。第2段階(2050年代)は共同学習エージェント──AIエージェントが学習チームの一員として参加し、人間学習者と知識を共同構築。第3段階(2070年代)は関係論的教育──人間・人工知能・自然・将来世代が1つの「同席の場」として教室を構成。フレデリック・コメニウス『大教授学』(1657)・ジョン・デューイ『民主主義と教育』(1916)・パウロ・フレイレ『被抑圧者の教育学』(1968)・マラグッツィ『レッジョ・エミリア・アプローチ』(1980〜)の教育思想史の系譜が、関係論的教育の理論基盤を構成する。
4時点の高解像度社会像 ── 朝のシーンから読む80年
フィジカルAIが産業技術として2026年から2100年へと展開する軌道の上に、人がどう朝を迎え、誰と食卓を囲み、どの街路を歩き、どこで働き、何を看取るかという生活の輪郭が立ち上がる。本章は、Phase 5で精緻化した4時点(2030/2050/2075/2100)の未来社会像を、朝のシーンを基点にした高解像度の記述として凝縮する。各時点に4箇所の朝を置き、その背後で動く5本の軸——物理空間の様態、協働構造、経済・労働、倫理・規制・統治、個人の生活・関係性——を畳み込む。最後に80年を貫く5つの転換を抽出する。
本章のシーンは、想像的構成だが、すべての登場人物が触れる技術・受けた教育・参加する制度・直面する規制は、2026年5月時点で実在する論文・実在の規制・実在の組織に根拠を持つ。架空の人物名はあるが、彼らがいる現場の精度は、Intuitive Surgical の インテュイティブ社 ダ・ヴィンチ第5世代 アニュアルレポート、米ウェイモ 56.7M rider-only miles safety analysis(arXiv 2505.01515)、Xiaomi 北京 EV 工場の76秒タクト、宇宙航空研究開発機構/Toyota Lunar Cruiser 仕様、米航空宇宙局 Artemis II/III の再設計、CNSA 嫦娥6号サンプルリターン、厚労省 令和7年度介護テクノロジー報告書、国際ロボット連盟 World Robotics 2025 などの一次資料から派生している。
4時点の選び方には理由がある。2030年は第3章で示したVLA基盤定着期の終端であり、ヒューマノイドが構造化作業領域で標準装備となる入り口である。2050年はパラダイムシフト中盤、AGIと核融合と生体素材が同時に立ち上がる時期にあたる。2075年は知性社会移行期、関係論的存在論が制度の参照点として組み込まれ始める段階である。2100年は関係論的物理生態系の到達点、ロボットという概念が個別機械から分散身体へ転換し、知性のオーケストラが日常運用となる段である。この4時点は、前プロジェクト「企業活動の現場で求められる人材の未来 2030-2100」の4時点と同期しており、技術側と人材側の両方から同じ未来を二重らせんとして読むことを可能にする。
9.1 2030年の朝 ── VLA基盤が現場に降りる
ロッテルダム港、朝6時20分。荷役主任のヤン・デ・フリースは自宅のキッチンでコーヒーを淹れながら、タブレットの「フリート状態」を確認する。前夜のシフトでMaasvlakte IIターミナルに入庫した アジリティ社 ディジット 群が、夜間に38台動き、コンテナの開梱・パレタイズで MTBF 2,100時間を維持している。彼の現場では OpenVLA 系の単一モデルが アジリティ社 ディジット と隣の アプトロニク社 アポロ を共通制御する設計が2028年に導入された。Toyota Canada が2026年2月に発表した「RAV4 工場への アジリティ社 ディジット 7 体導入」(TechCrunch 2026-02-19 報道)は、こうした VLA 共通制御方式が自動車製造から物流へ波及する初期事例となった。ヤンは「人が介入すべき判断」3件にフラグを付ける。ラベル不明の貨物、税関の急な書類追加、機械同士の譲り合いがうまくいかなくなった現場。出勤までの30分でフラグを消し、シフト交代のメッセージを書く。彼の役割は4年前までは「現場の指揮」だったが、いまは「現場と機械の翻訳」である。
ジュネーヴILO本部、朝8時45分。労働市場アナリストのアミナ・トラオレは、東欧と東南アジアの倉庫労働市場のダッシュボードを開く。米テスラ Optimus V3の量産開始、アジリティ社 ディジットの北米100台配備、Unitree G1 の販売価格2万元割れを経て、構造化作業領域の人件費競合点はほぼ突破された。背景には Agibot が2025年12月に5,000体目の量産ヒューマノイドをロールアウトしたという中国側の供給能力(Agibot プレスリリース 2025-12-15)と、国際ロボット連盟 World Robotics 2025 が公表した「2024年の世界産業用ロボット新規設置 542,076台、中国シェア 54%」という量的構造変化がある。経済協力開発機構 Future of Work 2024で「ロボット代替リスク高」とされた職種の45%が、現実に転換期に入っている。彼女が午前中に書くのは、フィリピンとベトナムの倉庫労働者の再訓練プログラムについての国際労働基準の改訂草案である。「代替」ではなく「移行」を制度の中心語にする草案だが、現実の置換速度はそれを超えている。
東京、品川区の高齢者集合住宅、朝7時30分。84歳の高井ヤエ子は寝室から居間へ歩いて移動する。床のセンサーが歩行リズムを読み取り、サイバーダイン社 補助スーツ腰タイプ介護支援用の派生型「Care Walker」が脇に立ち、必要なときだけ重量の20%を支える。HAL腰タイプは IPX4 防水・重量3.1kg・稼働約4.5時間という公式仕様(Cyberdyne 公式 2025)を持ち、入浴介助を含む腰部負担軽減を実装する。台所では Toyota Human Support Robot の後継機が、朝食の用意で容器の蓋を開ける作業を引き受ける。Toyota は2025年、HSR の自律移動技術が病院内搬送ロボット Potaro へ、物体認識・判断・動作実行技術が工場ロボットへ応用されたと公表した。浴室の鏡には Esteva 2017 系譜の皮膚診断 人工知能 が組み込まれ、ヤエ子の頬の小さなシミの経時変化を追う。だがヤエ子と話すのは、息子の妻からの音声メッセージと、週2回訪問する介護士の真鍋ハルカである。機械は周辺労働を引き受け、関係性労働はハルカが運ぶ。書籍第8章「ケアの非対称分業」の制度化の入り口に、東京は2030年に立っている。厚労省の令和7年度介護テクノロジー開発等支援事業報告書は、2025年度に142社・延べ304件のリビングラボ支援を実施し、特養493カ所の約9割が介護用リフト・見守り支援機器を導入したと報告した(厚労省 2026-03-13)。介護報酬制度は2027年改定で「介護ロボット加算」を本格化し、2030年改定で「ロボット導入を前提とした人員配置基準」を初めて導入する。
ナイロビ、Kibera地区、朝6時00分。22歳の電子整備工アブドゥル・カマウは、自転車で Konza Technopolis に向かう。ケニア政府が John Deere "See & Spray Ultimate" の系譜を引き継ぐ国産農機の組立工場をKonzaに置いたのは2027年で、彼はその第2期採用組である。仕事は 中国 EHang EH216-S(CAAC 2023年型式証明取得、2026年量産機)の部品検査と、独自設計の小型農業ドローンの最終組立である。月給は2024年の同職種の3倍で、これがケニアの大学進学率を押し下げる方向に働く。フィジカルAI普及はアフリカ大陸で、教育路線と労働市場のあいだに新しい亀裂を作りつつある。一方で、Konza が選ばれたのは、医療ロボットの遠隔診療試験(NTT IOWN APN の派生)の南半球拠点としての位置にもある。アブドゥルは将来、2050年に「ロボット運用倫理監査人」の第1期世代として、SOAS の遠隔修士課程を修了する。
2030年の物理空間は、フィジカルAIを「導入したところ」と「導入していないところ」のモザイクである。閉鎖空間ではヒューマノイドが標準装備となり、国際ロボット連盟 World Robotics 2024 の2023年末稼働台数4420台が1,0000台超に達する。年間出荷台数は54.10台から100-1500台へと倍増する。Boston Dynamics Atlas Electric(2026年公開の量産版、Hyundai 工場への2028年展開予定)の油圧から電動への世代交代がこの時期に完成し、平均価格は2-5万ドル、固体電池量産化で連続稼働は8-12時間に延びる。家庭への浸透はウェアラブルとAIスピーカーが先行し、Optimus/Figure/1X Neoの家庭試験投入は富裕層と早期採用者の趣味の領域にとどまる。米ウェイモ One は2026年5月時点で11都市・1,400平方マイル超に拡張し、週500回超の完全自動運転乗車を提供している(米ウェイモ 2025 Year in Review)。eVTOL は商用観光と救急医療搬送で実用化し、米ジョビー・米アーチャー・中国 EHang EH216-S が各極で先行する。データセンターの世界消費は IEA 推計で2022年460TWhから2026年最大1050TWhへ倍増し、Microsoft × Three Mile Island、Google × Kairos といった 人工知能 × 原子力の構造的合流が駆動される。
協働は「人+ツールとしてのフィジカルAI」が中核である。ヒューマノイドはまだ「業務支援道具」として認識され、「協働相手」ではない。しかし関係論的存在論の予兆は出現する。現場で「機械を育てる」という動詞が普通になり、VLAのファインチューニングが現場で行われる。AlphaFold 2と3が確立した「計算で構造を予測する」が創薬・材料・農業の標準ワークフローに組み込まれ、研究者はAIと「共著者」として論文を書く慣行が広がる。手術ロボット領域では、Intuitive Surgical の インテュイティブ社 ダ・ヴィンチ第5世代(2024年3月 FDA 510(k) クリアランス、2025年に インテュイティブ社 ダ・ヴィンチ 手術約315.30件・設置1,721台のうち インテュイティブ社 ダ・ヴィンチ第5世代 が870台)が普及拡大し、Medtronic メドトロニック社 ヒューゴ は2025年12月に泌尿器FDA クリアランスを取得、J&J ジョンソン・エンド・ジョンソン社 オッタヴァ は2025年4月に初症例を完了して臨床証拠収集段階に入る。これら3社の競合は2030年に向けて、外科医・看護師・人工知能 エージェントの6項関係を診療現場で初めて常態化させる。
労働市場は構造化作業領域での再編が最も早く進む。製造業の雇用は先進国で2024年比15-25%減少するが、ロボット運用・データキュレーション・モデル監査・現場通訳という新職種が10-15%創出される。Frey & Osborneが示した自動化リスクの分布は「半分は実現、半分は別の職種への再配分」として現れる。賃金は2極化し、新職種の上位層は2024年比150%水準、置換された層は60-80%水準へ移動する。規制空間はEU 人工知能 Actを中心に組み上がり、米国の州レベル規制と中国の生成AI管理規定が3極構造を形成する。アフリカ連合・南米共同体は EU 人工知能 Act と協調し、「西側」「中国」「ハイブリッド」の3つの規制ブロックが緩やかに分化する。
個人にとってフィジカルAIは「便利な機械」である。高井ヤエ子は Care Walker を「使う道具」と認識するが、台所の トヨタ 家庭支援ロボット 後継機を「テル君」と名付ける。Sharkey & Sharkey 2012 が警告した擬人化の一形態だが、ヤエ子にとっては道具との関係を生活に編み込む小さな手続きである。これは鉄腕アトム神話の文化的下地(CLA myth_data D1600-1699 系の日本支流)が、ヤエ子の世代に内面化されていることの結果である。子育てではAIチューター(Khanmigo延長、Kestin et al. 2024で効果量d=1.21)が中学校で標準装備となり、親は「AIと一緒に学ぶ子をどう見守るか」という新しい教育課題に直面する。書籍第16章が論じる「成熟した諦め」の議論の入り口に、社会は2030年に立っている。
9.2 2050年の朝 ── パラダイムシフトが家庭に届く
サンパウロ、Vila Madalena地区、朝6時45分。47歳の都市生態系デザイナーのカミラ・サントスは、自宅マンション屋上の「Living Roof」で藻類培養槽の状態を確認する。Solar Foods Solein 系統の派生で、サンパウロ市は2042年から市内2,000棟のビル屋上を Precision Fermentation 拠点に転換した。屋上の壁面はペロブスカイトタンデム太陽電池で、彼女のマンションは年間電力の140%を発電する余剰電力供給者である。出勤の足は地下のスマートエレベータと地上の 米ウェイモ One ブラジル版(米ウェイモ は2030年代に南米拠点を拡大)で、車内で彼女は「汎用人工知能 共同診療」の予約を確認する。Beam & Kohane 2018 が25年前に予測した医療プロセスは、いまや病歴聴取から治療計画までを Med-PaLM 系後継と医師が共同で行う標準形態である。手術ロボットの世代は インテュイティブ社 ダ・ヴィンチ 7 と Medtronic メドトロニック社 ヒューゴ 第3世代に進み、両者の単一統合制御プラットフォームが2048年に欧州 MDR で承認された。J&J ジョンソン・エンド・ジョンソン社 オッタヴァ の後継はラテンアメリカ向けに価格を引き下げ、サンパウロ市の中堅病院でも標準装備となっている。
レイキャヴィーク、朝8時00分。地熱発電所の運用責任者ヨンナ・グズムンスドッティルは、4kmの通勤を Toyota の量産ヒューマノイド T-Companion と共に歩く。T-Companion は彼女の祖父の代から続く家系の「労働の相棒」で、10年前に死別した夫の遺品として家庭に残っている。発電所では CFS ARC 系列の小型核融合炉が、地熱・水力と並行運転している。彼女の仕事は「核融合炉の知能層を育てる」ことで、自己改善 汎用人工知能 が運転最適化を学習するときの「目的関数」を設計する役割である。これは Bostrom 2014 が論じた Orthogonality thesis の現場実装にあたる。汎用人工知能 の目的関数を「どう書くか」が、人類が 汎用人工知能 に何を望むかの定式化そのものになる。
ヘルシンキ、Kalasatama地区、朝7時30分。62歳の人類学者ペッカ・ハッカネンは、Helsinki 3D+ デジタルツインの更新会議に出席するために自宅を出る。彼の自宅から会議室まで歩いて12分の距離は、Carlos Moreno 提唱の 15-Minute City の延長で設計された街区を通る。歩道には自己修復コンクリート(Henk Jonkers, TU Delft 2010年バクテリア型の派生)が敷かれ、夜のうちにロボット施工で補修が完了している。会議の主題は「都市生態系の参加権」で、テ・アワ・トゥプア法系統の制度を Kalasatama 地区の生態系(公園の樹木群、運河の魚群、屋上菜園の植物群)に適用する草案である。汎用人工知能 共同診断、Bio-Hybrid 臓器、Active Inference の産業実装が標準化した時代、市民が次に問い直すのは「機械と生命の境界」である。
東京、北千住の小規模介護施設、朝7時00分。72歳の元エンジニア真鍋ハルカ(2030年の高井ヤエ子の介護士の20年後)は、自分が施設で受ける側になった。施設は HAL 系の介助スーツ、トヨタ 家庭支援ロボット 後継の配膳・移乗、Cyberdyne 介護ロボの全身入浴支援が標準装備で、介護士1人で利用者10名を看られる体制である。これは厚労省が2029年度 KPI として掲げた「ICT・介護ロボット導入事業者割合 90%」(2023年度暫定29%→2029年度目標90%)が達成された結果である。一方で、入浴の温度・水流の調整は介護士の判断で行われ、入浴中の会話・歌・手の温もりは人間が運ぶ。介護ロボット国際標準 ISO 13482 系列が、2045年に「身体接触ロボットの責任分界・ログ保存・遠隔監督・施設責任者資格」を義務化した。Robear 系の全身移乗ロボットは限定実証から「夜間用」として常設運用へ移ったが、夜間専門の見守り介護士は今も人間である。
ナイロビ、Kibera 地区、朝6時00分。20年前に電子整備工だったアブドゥル・カマウは、いま42歳の「ロボット運用倫理監査人」である。ケニアの教育制度改革(2034年学習指導要領改訂、AI倫理を必修化)の第1期世代の代表で、ロンドン大学SOASの遠隔修士課程を修了した。彼の仕事は、ケニア国産農業ドローンと自律トラクタが圃場で誤作動した際に、責任の所在と再発防止の制度設計を行うことである。月給は2030年代の彼の3倍で、これがいまアフリカ大陸の中産階級の典型像となっている。アブドゥルの仕事が「監査人」として制度化されたのは、2040年代後半に Bostrom-Russell 系の 人工知能 安全議論がアフリカ連合の規制枠組みに取り込まれた結果である。経済協力開発機構 の「変革コンピテンシー」(経済協力開発機構 Learning Compass 2050)が、アフリカ大陸の教育課程の中核に組み込まれた。
2050年の物理空間は「自己適応化」のフェーズに入る。建築物・橋梁・歩道・配管が使用パターン・気象・劣化に応じて自己修復・自己再構成する。家庭は完全に変わる。Optimus/Figure/1X Neoの家庭普及率は先進国都市部で30-50%、移乗・排泄・入浴の三大重労働の機械化が在宅介護にも広がる。介護報酬体系がロボット導入を前提として再設計される。都市は「人間+ヒューマノイド共存」の前提で再構成され、エレベータ・歩道・店舗の動線が「人とロボットの混合フロー」を想定した寸法・速度・優先順位で設計される。自家用車所有率は先進国都市部で30%以下に低下し、米ウェイモ 型 L4 と 米テスラ 型 FSD Unsupervised が共存する。エネルギー空間では核融合複数商用稼働、固体電池・Li-S・金属空気電池のミックス、ペロブスカイトタンデム発電の普及で、製造業のエネルギーコストは2024年比で40-60%低下する。生命系空間が新しいカテゴリとして立ち上がる。Living Roofの藻類培養槽、AI設計微生物群によるカーボン農業、Bio-Hybrid Robotによる果樹剪定・接ぎ木・受粉補助が、都市と農村に編み込まれる。
協働は「人+AGI共同診療+フィジカルAIケアロボ+専門AIエージェント群」の多層構造となる。書籍第9章「知性社会」の関係論的存在論が、医療・農業・製造・都市計画の制度設計の参照点として明示的に組み込まれる。製造現場は「育てる」段階に完全移行し、VLAはクロスエンボディメント転移を完成する。単一モデルが2足・4足・産業マニピュレータ・移動車両・水中ロボット・飛行体を共通ポリシーで操作する。Hyundai/Boston Dynamics Atlas の2028年からの全工場展開、Toyota Canada の RAV4 工場の アジリティ社 ディジット 拡大、XPeng IRON と Walker S2 の中国全車両工場標準化が、2040年代に「車両工場 = ヒューマノイド第1展開地」を確立した結果である。教室は「人間の教師+生徒+AIチューター+ロボット教師+没入学習空間」の5項目構成となる。Belpaeme et al. 2018 が予見した「ロボット教師は人間教師を置き換えるのではなく補完する」が制度化される。Self-Driving Lab(A-Lab系譜、Coscientist 2023延長)が消費財・医薬品・素材研究で標準ツールとなり、論文の方法欄に「AI設計ステップ」が記述される比率が9割を超える。
労働市場は質的変容が完成局面に入る。製造業の雇用は先進国で2024年比50-60%減少する一方、生産量は1.5-2倍に増大する。介護・農業・建設で人手不足が解消される一方、ロボット運用・調整・倫理設計の専門職が生まれる。「働く」という動詞が、賃金を得るための時間消費ではなく、「複数知性の同席に参加する」「譜面を書く」「楽団員として座る」に向けて拡張される。Universal Basic Income系の制度設計が現実的選択肢として議論される段階で、ドイツ・フィンランド・カナダで部分実証が始まる。倫理空間は「治療」と「拡張」の境界をめぐる議論が中核となる。BMI普及(Neuralink・Synchron・Paradromicsの系譜)が、Beauchamp & Childressの四原則に第5の原則「関係性の維持」を追加する議論を呼ぶ。自然権の制度化が進み、テ・アワ・トゥプア法・エクアドル憲法・ボリビア母なる地球法の系譜が、北欧諸国・カナダ・スイス・南アフリカで国内法として採用される。
個人は「AIと一緒に生きる」を当然の前提として育つ。家族構造は多様化し、単身高齢者世帯の比率は先進国で5割を超える。フィジカルAIが「家族の代替」ではなく「家族の補完」として、また「人と人の関係を媒介する第3者」として機能する。ヨンナにとってT-Companionは亡夫の代わりではないが、20年共に過ごした関係の継続装置である。これはSharkey & Sharkey 2012の擬人化警告とは別の次元の関係性で、まだ社会的言語化が追いついていない。死生観は本格的に変わる。健康寿命が先進国で90歳水準に達し、Sinclair系のエピジェネティック・リプログラミング(Yang, Hayano, Sinclair et al. 2023)が選択的介入の臨床到達範囲に入る。書籍第16章が論じる「成熟した諦め」の議論が個人レベルで深まる。
9.3 2075年の朝 ── 知性社会移行期の生活
月面 Shackleton クレーター研究基地、地球時間で午前6時00分。35歳の植物-月面農業デザイナーのマリア・ロドリゲスは、基地の「Living Module」で植物電気生理シグナルを読む。米航空宇宙局 Artemis 計画は2026年4月の Artemis II 有人月周回ののち、2027年の Artemis III 低軌道デモを経て、2028年以降に有人月面着陸を段階的に再開した。2030年代から 宇宙航空研究開発機構/Toyota Lunar Cruiser(有人与圧ローバー、燃料電池駆動、月面 -170〜120℃ 環境対応)と GITAI のロボットアーム(2025年3月 宇宙航空研究開発機構 概念検討契約、月面基地建設「労働力」)の組合せで、2055年に月面恒久基地が稼働、2068年に Living Module 第3世代が運用開始した。マリアはトマトと小麦の派生種の応答を、Vivent SA の PhytlSign 後継アプリで監視する。植物の電気信号・揮発性有機化合物・根圏微生物コミュニケーションを統合解析する「Plant Foundation Model」が、Trewavas 2014 の理論基盤を50年で工学実装した結果である。彼女の役目は「月面の植物との対話」で、地球から遠く離れた閉鎖環境で植物-機械-人間の三者協働を成立させることである。中国の嫦娥プログラムが2024年に世界初の月裏側サンプルリターン(1,935.3g)を達成して以来、月南極での米・中・国際 ILRS の三経路は2050年代に「月面農業の共通プロトコル」で部分統合された。マリアの研究は、その共通プロトコルの植物寄りの拡張を担う。
ジャカルタの「再生工場」、朝7時15分。54歳の物質代謝デザイナーのブディ・ハルトノは、自宅から徒歩10分の再生工場へ歩く。工場の名は10年前まで「Plastic Recycling Facility No.7」だったが、2065年に「Material Regeneration Hub」に改名された。Self-Driving Lab(A-Lab 後継)が消費財・医薬品・素材の大半を担い、Bio-Hybrid Robot が日用品となり、製品は「修理」されるのではなく「再生」される。Wang & Urban 2020 の自己修復ポリマー、Brodin et al. 2015 の酵素的 DNA 組立、Boo, Khalil et al. 2024 の機械学習による合成微生物群設計が統合され、製品は「自分で組み立て・自分で修復し・寿命を迎えれば自分で分解する」段階に入った。ブディの仕事は「物質の流れの譜面を書く」ことで、東南アジア島嶼部の物質代謝を統合管理する。彼が参照する制度フレームは、清水博「場の理論」の工学的派生として国際機械学会が2068年に標準化した「述語的製造規格」と、欧州 ANT 派生の「アクタネットワーク責任分配規格」の2系統が並列運用されている。
愛知県、旧名古屋市東部、棚田の上の村、朝5時30分。67歳の元エンジニア、田島和正は、孫娘(11歳)と一緒に村の棚田を見回る。棚田は彼が定年後10年かけて、放棄水田を「植物-人工知能 連携農業」の実証拠点に転換したものである。圃場では Calvo, Sahi & Trewavas 2020 が提起した植物の感受性研究の延長で、稲の生育状態を植物電気シグナルで読みながら、Bio-Hybrid Robot が受粉補助と病害監視を行う。和正の孫娘は中学校で「存在間調停力」を学んでおり、棚田の生態系を「契約相手」として扱う言葉を持っている。書籍第13-14章が論じる伝統知の参照点が、里山再生のなかに別の形で立ち上がりつつある。鶴見和子の内発的発展論が、Phase F-G の里山プロジェクト運用の理論基盤として中学校国語教科書に登場するようになった。和正と孫娘の朝の見回りは、その教科書の例題として撮影されたこともある。
太平洋赤道域、洋上海洋研究所「Pelagia」、朝6時00分。28歳の海洋生態系-人工知能 通訳のレイラ・ハッサンは、研究所の浮体プラットフォームから海中ドローン群の朝の点検を行う。ドローン群は赤道反流の生態系を24時間監視し、データは「Marine Foundation Model」に流れる。レイラは BMI(侵襲型、Neuralink 系の選択的拡張デバイス、5年前に装着)で、ドローン群の状態を直接「感じる」。Andy Clark 1998 の拡張認知が文字通りインフラ化した時代、レイラの「私」は海中の25台のドローンを含む分散的存在である。レイラの BMI は、川人光男の内部モデル理論を2060年代に拡張した「分散内部モデル」を基盤に設計されており、25台のドローンそれぞれの順モデル・逆モデルが、レイラの小脳に補助的にマッピングされる。
2075年の物理空間は「生命系製造期」の到来によって質的に変わる。建材としての生体素材(菌糸体ベース、藻類由来BioMASONコンクリート、CO2固定セメントSolidia/Carbicrete系譜)が主流化し、都市そのものが大気中CO2を固定する炭素シンクとなる。製造空間は「組み立て」から「成長・再生」へパラダイム転換する。Swarm ロボティクス(Rubenstein et al. 2014)の延長で、製造現場は数千-数万の小型ロボットの群知能で運営される。製造業の従業員規模は先進国で2024年比80%減少する一方、「物質代謝デザイナー」「生命系製造監督者」「倫理-存在論的設計者」という新カテゴリが立ち上がる。エネルギー希少性は実質的に消える方向に進み、CFS ARC・Helion Energy・TAE Technologies の核融合と Caltech SSPP 系統の宇宙太陽光発電の GW 級商用運転の併用で、製造業のエネルギーコストはほぼゼロに近づく。Smil 2017 が序列化した5段の prime mover に対する第6次(人工知能-orchestrated multi-source)が2070年に商用稼働を達成する。宇宙が物理空間の重要カテゴリとして登場し、都市設計と宇宙居住設計が同一の設計言語(生命維持・閉鎖循環・自己修復・自律性)で語られる。
協働は「人間-人工知能-生命-植物-機械-環境」の6項関係として組み立てられる。医療は「治療」から「予防+関係性ケア」への移行が中盤に入る。Bio-Hybrid 技術と iPS 派生組織構築が、人工心臓・人工膵島・人工腎臓・人工肝臓の生体素材化を実現する。Microbot Medical LIBERTY(2025年9月 FDA 510(k))の系譜が、末梢血管内ロボットの「単回使用・遠隔操作型」を2050年代に体内ナノロボの常用版へ拡張した。認知症ケアが BMI と統合され、軽度認知障害から中等度認知症の患者で記憶補助・空間定位支援・人物認識補助として制度化される。ケア労働は構造的に再編される。移乗・排泄・入浴・薬剤管理・記録・スケジュール調整・見守りはフィジカルAIが担う。残るのは「触れる、聞く、見つめ続ける、共在する」という関係性労働で、看護師・介護士の専門性は「機械が担えない関係性」として制度的に再定義され、社会的地位と報酬が大幅に上がる。農業は「植物との対話」が中核になる。植物電気生理シグナル → 人工知能 意思決定 → アクチュエータ介入のループが、人間の介入なしに圃場・温室・垂直農場で常時動作する。
労働は「譜面を書く」と「楽団員として座る」の二種に集約される方向で進む。前者は目的設計・倫理設計・美的判断・関係設計を担う層で、後者は人間-人工知能 協働のなかで身体的・関係的・経験的価値を生む層である。賃金制度は根本から変わる。エネルギー希少性が実質消失し、Self-Driving Lab が消費財・医薬品・素材の大半を担う時代、「労働時間×賃金単価」のロジックは崩壊する。Universal Basic Income 系の制度がフィンランド・カナダ・ドイツ・オランダで本格実装され、賃金は「関係性の質」「譜面の品質」「楽団員としての貢献」で評価される。倫理空間は「人間中心」から「関係中心」への転換の中盤にある。自然権の制度化が国際標準として進み、生態系を「契約相手」として扱う実務が、農業・建設・都市計画・エネルギー産業の前提条件となる。ロボット権利の議論が、SF の思考実験から制度設計の論点へ移る。「電子人格(Electronic Personhood)」の制度設計が欧州・北欧・カナダで議論される(欧州議会2017年決議の延長)。
個人は「私とは何か」が選択の問題として日常的に意識される時代を生きる。レイラの BMI で海中ドローン25台と直接接続している自分は、書籍第11章の関係論的存在論が日常実践に降りた形態である。「私」の輪郭は身体の皮膚で切れず、ドローン・人工知能・植物・微生物・コミュニティの関係の網へと拡張される。家族構造は世代を超えた継承装置として再定義され、田島和正と孫娘の棚田の場面では、20年リードタイムが教育制度を介して2つの世代を結ぶ。健康寿命が先進国で95-100歳水準に近づき、Sinclair 系のエピジェネティック・リプログラミングが選択的介入として制度化される。BMI を装着した者の「死」とは何か、ドローン25台と接続したレイラの「個」がどこで終わるか、という新しい問いが文学と哲学の中心テーマとなる。河合隼雄が21世紀初頭に「日本人の自我は西洋型の閉じた個ではなく、関係のなかで揺れる個である」と論じた古典が、2075年に世界共通の人格論として読み直される。
9.4 2100年の朝 ── ヘルシンキの卓を囲む
2100年の朝の典型場面は、ヘルシンキKalasatama地区の集合住宅の集会室にある。書籍第17章「同席」が描いた「人間・人工知能・ロボット・自然観測ネットワーク・伝統知の運び手・地域共同体の代表が、対等な参加者として1つの卓を囲む」構図が、フィジカルAI時代の典型場面として日常化している。
朝7時45分、卓を囲むのは7人と3つの「人ではない参加者」である。8歳のアンナとその祖母エリナ(83歳)。地域協議会の代表である41歳の都市生態系管理者ヨハネス。74歳の元エンジニア、亡夫のCare Walkerと共に座るマルタ。Plant Foundation Modelのローカルインスタンスを介して話す「Kalasatama公園の樹木群の代表」。BMI 接続で会議参加する月面基地から赴任中の研究者ペッカ・ハッカネン孫世代のオウル(27歳、2075年朝のシーンの人類学者ペッカの孫)。「未来世代の利益を代表する仮想エージェント」として2100年-2200年の時間軸を扱うAGIエージェント「Tulevaisuus」(フィンランド語で「未来」)。そして卓の中央には小型のBio-Hybrid Robotが「同席の触媒」として置かれ、Active Inference系の自由エネルギー最小化アルゴリズムで、会話のリズムと沈黙の配分を整える。
議題は2件ある。第1は、Kalasatama公園の樹木群のうち寿命を迎えつつある34年前に植えられたシラカバ3本を「どう看取るか」である。樹木群の代表はPlant Foundation Model経由で「3本のシラカバは光合成効率の低下と病害の進行を示している」と伝える。Tulevaisuusは「2150年の景観への影響」と「未来世代の里山再生への含意」を提示する。アンナは「3本のシラカバの根元の土をどこに運ぶか」を質問する。第2の議題は、地区の物質代謝の年次計画である。再生工場の運転、Living Roofの藻類培養スケジュール、Self-Driving Labのローカル拠点が産出する消費財の地区内配分が議論される。Bio-Hybrid Robotは卓を3度ゆっくり回り、各参加者の発話頻度の偏りを検知して「マルタの声がまだ出ていない」と低い音で示す。マルタは亡夫のCare Walkerに触れながら、地区で30年生きた者として「冬の暖かさをどう確保するか」を語る。エネルギー希少性が消えた時代でも、関係性の質と所属の感覚は人間に固有の問題として残り続ける。
2100年の物理空間は「関係論的物理生態系」の到達点として運用される。フィジカルAI は「個別機械」から「分散身体」への転換を完成し、ロボットという概念が消え、物理操作能力が環境・建物・道具・身体に分散的に埋め込まれる ambient embodiment が標準となる。都市は「複数の知性が協調する知性のオーケストラの物理身体」として運用される。建材は新陳代謝し、配管は自己診断し、空間は使用パターンに応じて再構成される。Christopher Alexander 1977 の「都市は生きている」という命題が文字通りの意味で実装される。エネルギー・物質の閉鎖循環が都市レベルで完成し、廃棄物は分子レベルで分解・再構成され、都市は実質的に「外部から物質を取り込まず、外部に廃棄しない」閉鎖系として運用される。これは惑星境界(Rockström et al. 2009)論の解決策の一形態として、地球システム科学の文脈で位置づけられる。
協働は「知性のオーケストラ」として完成局面に達する。単一AGIではなく多様な知性の編成体系として運用される。1つのタスクには複数の認知システム(環境モデル・身体スキーマ・社会的推論・言語理解・予測符号化・自由エネルギー最小化)が並行して関与し、それぞれが状況に応じて主導権を交替する。人間の脳もまた、このオーケストラの1つの楽器として参加する。健康寿命100歳が先進国の中央値として成立し、医療の中心は「治療」から「予防+関係性ケア」へ完全移行する。製造現場は「指揮者なき協奏」として運営される。汎用VLAロボティクスが機械加工・組立・物流の物理層を、生体素材・合成生物製造が消費財・医薬品・建材の生産を、量子-古典-生物の3層計算が材料設計・最適化・予測を、Active Inference・World Model・BMI が人間-機械の認知接続を担う。
経済は「事業の概念自体が再定義される」段階に達する。フロー型からストック型への完全移行が完成し、企業は製品販売数ではなく「都市・インフラ・関係性の運用品質」で評価される。製造業は雇用統計上のカテゴリとしてほぼ消滅し、人類の労働の中心は「譜面を書く」「楽団員として座る」の二種に集約される。労働時間は週20時間以下が標準となり、人間は「意味付け」「価値設計」「他者ケア」「創造的探究」に集中する。統治は「分散化と関係化」の到達点として運用される。中央集権的な国家統治から、文脈と判断レベルに応じた動的協調モデルへの転換が完成する。中央政府・地方自治体・地域コミュニティ・AGIエージェント・自然権主体・未来世代代表が、それぞれの意思決定領域を持ちつつ、相互の関係のなかで動的に主導権を交替する。
個人は、書籍最終句が描いた「知性とともに時代を横断しながら歩む者」として生きる。家族構造は血縁・婚姻・同居を超えて「関係の網」として再定義される。エリナとアンナ、マルタの亡夫のCare Walker、Tulevaisuus、月面のオウル兄が、それぞれの関係性の濃度と形態のなかで「家族」と呼ばれる。死生観は「成熟した諦め」が日常実践として根付いた段階にある。健康寿命100歳が先進国の中央値となり、加齢関連疾患の発症が後ろ倒しされる。マルタの亡夫のCare Walkerが彼女の生活に残り続ける構図は、死が関係を絶つのではなく、関係の形態を変えるという認識を社会的に共有する装置である。アンナは中学校で、自分が複数知性のオーケストラの1つの楽器であることを学ぶ。彼女の「私」は皮膚で切れる個体ではなく、家族・友人・公園の樹木・Tulevaisuus・月面のオウル兄を含む関係の網のなかで立ち上がる。だが同時に、彼女には固有の声、固有の音、固有の関係への投じ方がある。それを失わずにオーケストラに参加することが、2100年の「人として生きる」の中核となる。
9.4.5 朝のシーンを貫く5要素
本章で描いた4時点14回の朝のシーンは、ばらばらの想像的構成ではなく、「譜面を書く者の朝の段取り」という共通構造を持つ。共通構造の5要素:第1に場の確認──机のうえに何が並んでいるか、誰が同席するか、どの問いが残っているか。第2に関係の調律──昨日からの継続関係を確認し、今日の新しい関係を準備する。第3に判断軸の言語化──機械に任せること、人間が引き受けること、未来世代に手渡すことを言語化する。第4に骨格の提示──細部を決めず、関係の網の骨格を時間軸のなかに置く。第5に朝の閉じ方──朝の段取りを次の人へ手渡し、昼の作業に入る。この5要素は、ヤン(2030年ロッテルダム港)からアンナ(2100年ヘルシンキKalasatama)まで、74年を貫く譜面を書く者の作法である。
9.4.6 朝のシーンの地理的多様性
本章の14シーンは、地理的に意図的な多様性を持って配置されている。ロッテルダム港(蘭・物流)、ジュネーヴ(瑞・国際労働)、東京(日・介護)、ナイロビ(ケニア・新興技術)、サンパウロ(伯・都市生態系)、レイキャヴィーク(氷・核融合)、ヘルシンキ Kalasatama(フィンランド・関係論的都市)、月面 Shackleton クレーター(極限環境)、ジャカルタ(インドネシア・物質代謝)、愛知棚田(日・里山再生)、太平洋赤道域(海洋)の11地域に分散。意図は3つ:第1に欧米中心の未来描写を回避し、グローバルサウスの実装現場を含める。第2に都市・郊外・極限環境(宇宙・海洋)の3スケールをカバー。第3に2030年代の物流現場から2100年代の関係論的都市まで、技術発展段階を地理的に分散して配置する。これにより、フィジカルAIの実装が地理的に均質ではなく、地域固有の文脈で展開することを可視化する。
9.4.7 朝のシーンの倫理的含意
14シーンに登場する人物が直面する倫理的問いは、3層に整理される。第1層個人的問い──「自分が判断する範囲はどこまでか」「何をAIに任せ、何を残すか」。第2層関係的問い──「この場の他の参加者(同僚・家族・AIエージェント・植物・将来世代)の声をどう聞くか」「関係の質をどう編み直すか」。第3層制度的問い──「規制・倫理規範・社会契約をどう遵守し、どう更新するか」。3層は階層的ではなく、朝の30分の段取りのなかで同時並行的に処理される。譜面を書く者は、この3層の同時処理を日常実践として身体化している。
9.5 80年を貫く5つの転換
4時点を時系列で見直すと、フィジカルAI時代の社会変容は次の5つの転換として整理される。これらは独立した変化ではなく、互いに駆動し合う構造的転換である。
第1は物理空間の生命化である。物理空間が「死んだ素材の集積」から「自己組織化・自己修復・自己再生する生命系」へと変容する。2030年の3Dプリント住宅とSelf-Healing Concreteの入り口から、2050年の自己適応都市、2075年の生命系製造期、2100年の関係論的物理生態系へ、80年かけて物理空間の存在論的カテゴリそのものが書き換えられる。Stream 3(Bio)とStream 4(Materials)の合流が、機械工学パラダイムから生命系パラダイムへの製造業の質的転換を実装する。机・椅子・食器・衣服・建物の壁は、機械でもなく生命でもない第3のカテゴリに属するようになる。所有・管理・廃棄の語彙が、再生・看取り・継承の語彙に置き換わる。
第2は協働範囲の拡張である。協働の範囲が「人間同士」から「人間+人工知能+生命+自然+機械」の多層関係へと拡張される。2030年に「ヒューマノイドは業務支援道具」だった認識が、2050年には「協働相手」、2075年には「関係の網の参加者」、2100年には「知性のオーケストラの楽器」へと段階的に深まる。Active Inference(Friston 2010, Pezzulo et al. 2022)、World Models(Ha & Schmidhuber 2018, Hafner et al. 2024)、拡張認知(Clark & Chalmers 1998)、分散認知(Hutchins 1995)、関係論的存在論が、協働範囲拡張の理論的基盤を提供する。人間同士の協働は「コミュニケーション」、人間と機械は「インタラクション」、人間と生命は「対話」、人間と自然は「契約」と、それぞれ異なる語彙が日常化する。書籍第17章の「同席」が、これらを束ねる上位概念として機能する。
第3は労働の意味の組み換えである。「働く」という動詞の意味が「賃金を得るための時間消費」から「複数知性の同席に参加する」「譜面を書く」「楽団員として座る」へと組み換えられる。2030年の労働市場再編から始まり、2050年の労働の意味の組み換え、2075年の譜面と楽団員の2分、2100年の文明維持からの人類解放へと、80年かけて労働概念そのものが変容する。米マッキンゼー 2024・Frey & Osborne 2017・Acemoglu & Restrepo 2020が示した自動化の経済学的軌道が、ヒューマノイド・自律実験ロボット・Bio-Hybrid ロボット・分散群知能による文明維持機能の段階的代替として現実化する。Universal Basic Income系の制度が標準化し、賃金は「関係性の質」「譜面の品質」「楽団員としての貢献」で評価される。
第4は統治の分散化と関係化である。統治の様式が「中央集権的な国家による上からの統治」から「文脈と判断レベルに応じた動的協調」へと変容する。2030年の3極規制ブロック(西側・中国・ハイブリッド)から、2050年の自然権の制度化、2075年の自然権・拡張認知・伝統知統合の重なり、2100年の指揮者なき協奏の統治へと、段階的に分散化と関係化が進む。テ・アワ・トゥプア法・エクアドル憲法・ボリビア母なる地球法の系譜が、自然権の国際標準化を駆動する。Tulevaisuus のような「未来世代の利益を代表する仮想エージェント」が、立法・司法・行政の重要意思決定に常時参加する制度が確立する。Le Corbusier 的な機能分離都市から Jane Jacobs 的な関係論的都市への完全転換が、政治哲学のレベルで実装される。
第5は個人の輪郭の再定義である。「個人」のカテゴリが「皮膚で切れる個体」から「関係の網のなかで立ち上がる関係的存在」へと再定義される。2030年のAIチューターとの非対称関係から始まり、2050年の拡張認知の中学校教室での前提化、2075年のBMI接続による分散的自己、2100年の「複数知性の同席に参加する楽器としての自分」へと、80年かけて自己理解の枠組みが変容する。Andy Clark & Chalmers 1998、Hutchins 1995、Varela, Thompson, Rosch 1991、Friston 2010が、自己理解の哲学的・神経科学的基盤を提供する。「私」の輪郭は身体の皮膚で切れず、ドローン・人工知能・植物・微生物・コミュニティ・未来世代の関係の網へと拡張される。しかし同時に、「私」には固有の声、固有の音、固有の関係への投じ方がある。それを失わずにオーケストラに参加することが、フィジカルAI時代の「人として生きる」の中核となる。
5つの転換は、フィジカルAIの技術系統合流の上に立ち上がる社会変容の輪郭である。次章では、この変容を生きる側からの能力地図を、前プロジェクト「企業活動の現場で求められる人材の未来 2030-2100」が描いた12能力モデルとフィジカルAI時代の追加要請として整理する。
譜面を書く者の作法 ── 12能力+αが指す方向
前章までは、フィジカルAIの技術軌道と、その軌道の上に立ち上がる4時点の社会像を描いた。本章では視点を逆転させる。この80年を生きる側からの問いとして、「人として何ができればよいのか」を整理する。手がかりは、前プロジェクト「企業活動の現場で求められる人材の未来 2030-2100」が示した12能力モデルである。これは2030年5能力、2050年4能力、2075年3能力、そして2100年の5核心能力を束ねた人材像の地図であり、フィジカルAI時代の能力要請と二重らせんを成す。
本書はこの12能力モデルを再掲しながら、フィジカルAIという技術系統が現場に降りる際に追加的に要請する能力を加える。前プロジェクトは「機械・人工知能・生命・植物・人間が譜面のうえで連携する74年」を人材側から描いた。本書は、その譜面のうえに立つ物理層を技術側から描いた。両者は、同じ未来を異なる側面から照らす。本章ではさらに、イノベーション理論(Innovation Theory DB の知見)から、Dyer-Gregersen-Christensen の「イノベーターのDNA」5要素(質問・観察・ネットワーキング・実験・関連付け)と、野中郁次郎・竹内弘高(1995年『The Knowledge-Creating Company』)の SECI モデル(Socialization → Externalization → Combination → Internalization)を、12能力+4項目と接続する。Dyer の5要素は個人能力の入り口を、SECI は組織能力の循環を、12能力は世代横断の能力地図を描く。3つは独立した枠組みだが、フィジカルAI 時代の現場ではこれらが1つの作法として束ねられる。
10.1 2030年 ── 5能力(AI判断調律から社会変革まで)
2030年に求められるのは、AIを使う関係を、自分の判断軸の言語化によって運用する作法である。前プロジェクトはこれを5つの能力で記述した。これは Dyer-Christensen の「質問する」「観察する」「実験する」の3要素が、人工知能 を相手に常時運用される時代の能力定式である。
第1はAI判断調律力である。AIが提案する選択肢を、自分の判断軸で評価し、3か所だけ調整して受け入れる、あるいは全面的に覆す。プロンプト設計や結果解釈の技術的側面ではなく、AIの出力に手を入れる場所と理由を言語化できることが核である。era-talents DBの「AI協働リテラシー」次元は、平成5.42から令和8.79への+3.37ポイントの非連続跳躍を示しており、これは他の能力次元では観察されない突発的変化である。この急峻な立ち上がりが、2030年代の調律者を要請する。ロッテルダム港のヤン・デ・フリースが、AIの提案に「人が介入すべき判断」3件のフラグを付ける作法は、この能力の典型である。Dyer の「質問する」が、人工知能 の出力に対する具体的な問いの設計として日常化する。
第2は知の代謝力である。世界経済フォーラムは2025年に「2030年までに労働力の59%が再教育を必要とする」と指摘した。職務スキルの陳腐化サイクルが高速化するなかで、古い知を捨て、新しい知を取り込み、循環させる代謝の速さそのものが基礎能力に昇格する。学び続ける力だけでは足りない。古い知を意図的に手放す力——アンラーニング——が同時に問われる。シンガポール発の「スキルズフューチャー」運動はこの代謝を国民の基本能力として位置づけた。SECI モデルの「内面化(Internalization)」を1度で完了せず、繰り返し脱-内面化-再内面化する循環として運用する作法である。
第3は揺らぎ運用力である。不確実性を排除すべき敵ではなく、運用すべき資源として扱う構え。世界経済フォーラムがスキル需要トップ10入りを予測する適応能力の核には、揺らぎを引き受ける身体性がある。サプライチェーン再編、地政学リスク、複合危機——いずれも、揺らぎを止めようとせず、揺らぎのなかで意思決定を続ける能力を問う。Henderson-Clark の「アーキテクチャル・イノベーション」が頻発する時代、組織は「コアコンポーネントは維持、連結方式を再編」を年単位で繰り返す必要がある。揺らぎ運用力は、この再編サイクルへの個人側の応答能力である。
第4は仮説実装力である。AIにより少人数で新規事業を試せる範囲が拡大し、仮説検証・市場投入・自動化設計を一体で進める実装能力が要請される。「精神」ではなく「実装」と体言化したのは、2030年代の起業家性が信条や姿勢ではなく、AIを増幅装置として使った具体的な発射回数で測られるからである。Sarasvathy のエフェクチュエーション5原則(鳥の手・許容損失・クレイジーキルト・レモネード・パイロット)が、フィジカルAI スタートアップの実装作法として標準化する。「手元の VLA モデル+自社ハードウェアから事業機会を逆算」する Figure・Apptronik・1X Technologies の行動様式が、汎用的な仮説実装力のテンプレートとなる。
第5は社会変革力である。利益追求と社会課題解決を両立するミッション・ドリブンな構えが、企業の人材吸引力そのものになる。マッツカートのミッション・エコノミー論——政府の役割を「失敗した市場の修正」から「課題駆動型の方向性の設定」へ拡張する論——が、企業経営にも浸透する初期段階である。社会変革は外部活動ではなく、自社の事業設計のなかに織り込まれる前提条件として2030年に立ち上がる。
フィジカルAI時代の追加要請として、2030年には機械を育てる作法が加わる。OpenVLA系の単一モデルが現場でファインチューニングされ、Digit と Apollo が同じ倉庫で別タスクを分担する時代、現場マネジャーの仕事は「自社の業務環境に機械を慣らす」役回りを含む。これは 人工知能 判断調律力の物理層への拡張であり、Khan, Wuest et al. 2022 が論じた Industry 5.0 の最初の実装層に重なる。野中・竹内の SECI で言えば、「共同化(Socialization)」を人間同士から人間-機械へ拡張する作法である。機械の動作を観察し、暗黙の癖を読み取り、それを言語化して他のオペレーターに伝える──これは Dyer の「観察する」「ネットワーキング」がフィジカルAI 現場で複合運用される姿である。
10.2 2050年 ── 4能力(AI停止責任から編み直しの体力まで)
2050年に求められるのは、AIとの関係を「使う」から「監査し、停止できる」へと逆転させる作法である。前プロジェクトはこれを4つの能力で記述した。Bostrom 2014 の Orthogonality thesis と Instrumental convergence が思考実験から運用課題に転化した時代、能力地図の重心は「人工知能 を増幅する」から「人工知能 を抑制する」へ移る。
第1はAI停止責任である。2030年が「AIを調律する」段階だったとすれば、2050年は「AIを止める」段階である。プロンプト設計の標準化を超え、AIの能力評価・安全性検証・停止条件を理解したうえで、いつ・どの判断で・誰の責任において機械を停止させるかを引き受ける。era-talents DBのage_oecd_transformative(OECD変革コンピテンシー)次元への言及は、future_2030時点では1件にすぎないが、future_2050では8件に跳ね上がる。経済協力開発機構 Learning Compass 2050を出典とする発見文には「人工知能・気候・民主主義の同時危機への対応能力が、世界市民に必須の基盤スキルとなる」とある。Russell 2019『Human Compatible』の整合性問題が教育課程の中核に入り、レイキャヴィークのヨンナのように「核融合炉の知能層を育てる」者には、止める判断の責任が組み込まれている。
第2は超域社会変革力である。2030年の社会変革力が1つの領域に焦点を絞った変革だったとすれば、2050年は複数の領域を同時に横断する変革が要請される。人工知能・気候・民主主義の同時危機が、それぞれ別個の問題としてではなく、相互に駆動する1つの絡まりとして現れる時代である。1つを最適化すると別が崩れる構造のなかで、緊張とジレンマを解消せず引き受けながら、領域を超えて社会変革を立ち上げ続ける作法が中核能力になる。OECDが2030年版で示した変革コンピテンシー——新たな価値創造、緊張とジレンマの調整、責任ある行動——が、複数システムの相互作用を読み、超域で束ねる段階へと深まる。
第3は意味づけの編集である。AIが既存表現を高速生成する2050年では、創ること自体は機械が担う。人間に残るのは「何を創るに値するか」を選び、社会的文脈のなかに位置づけ直す編集である。問題設定、審美判断、文脈づけ——これらが人間側の差別化能力になる。経営者の70%がスキル変化を予想する2050年では、生成ではなく編集が、企業競争力の源泉となる。学位より実行能力実証(バッジ・クレデンシャル)が採用基準の中核を占めると蓋然性として置く。この能力は2100年「物語を編む」への伏線でもある。Mokyr 2002 の Ω(propositional knowledge)と Λ(prescriptive knowledge)の2分法において、Λ の生成主体が 人工知能 へと移った時代、人間は Ω と Λ の橋渡し(orchestration)に集中する。これが「意味づけの編集」の認知科学的定義である。
第4は編み直しの体力である。長寿化と技術更新の二重曲線が同時に進む2050年代には、レジリエンスの意味が「折れない強さ」から「折れた後に編み直す身体性」へ書き換えられる。職業人生を通じて技能を何度も更新し、危機のたびに自分の働き方そのものを編み直す。70代以上の就業人口の大幅増加が常態化する2050年日本では、社会的自立性と経済的独立性の再定義が、編み直しの繰り返しのなかで進行する。
フィジカルAI時代の追加要請として、2050年にはケアの非対称分業の運用力が加わる。フィジカルAI が移乗・排泄・入浴の周辺労働を担い、人間が「触れる・聞く・見つめ続ける」関係性労働を担う構造のなかで、どこまでを機械に、どこからを人に渡すかの線引きを継続的に判断する能力である。Mol 2008『The Logic of Care』が示した「ケアの論理」と「選択の論理」の対比は、汎用人工知能 共同診断時代の臨床意思決定で参照される。さらに、汎用人工知能 共同診療の運用において、医師・看護師・介護士・患者・家族・人工知能 エージェントの6項関係をその場で編み直す力が、ヘルスケア領域の中核能力となる。インテュイティブ社 ダ・ヴィンチ 7、メドトロニック社 ヒューゴ 第3世代、ジョンソン・エンド・ジョンソン社 オッタヴァ 後継の3経路が並存する手術室で、麻酔科医とロボット制御チームのコミュニケーション・プロトコル設計者という新職種が立ち上がる。
10.3 2075年 ── 3能力(惑星システム読解力・異分野統合力・存在間調停力)
2075年に求められるのは、人間中心の視座から、地球システムと存在の多様性に向き合う視座への転換である。前プロジェクトはこれを3つの能力で記述した。
第1は惑星システム読解力である。気候変動、生物多様性喪失、汚染を一体の地球危機として扱い、食料・エネルギー・都市・健康を結ぶシステム思考が必須になる。惑星境界を運用指標化する能力が、企業の戦略立案の前提となる。era-talents DBの val_eco(エコロジカルリテラシー)次元への言及は、future_2030 の9件→future_2050 の20件(+11、最大増分)→future_2100 の6件と推移する。2100年で減るのは関心が薄れたためではなく、val_eco 単独では捕捉できない82個の新規概念(planetary_scale_systems_thinking、ecosystem_engineering、climate_adaptation、cross_cultural_collaboration、resilience_thinking 等。出典は IPCC・UN・UNESCO・Long Now Foundation)に分散・専門化するためである。惑星システム読解力とは、これらを束ねるメタ次元の総称である。個別領域の知見の集約ではなく、地球を単一の動的システムとして読み、その読みを日次・週次の意思決定に翻訳する継続的な作業である。
第2は異分野統合力である。生態学・経済学・倫理・地域実践を統合する能力、自然資本を経済会計へ組み込む発想、開発・人権・気候・デジタル公共財をつなぐ制度創造の能力。領域別専門性を越えた統合的な公共設計力が、企業の中核人材に求められる。era-talents DB の「異分野統合志向」次元は、明治期7.78から令和期7.61まで、全時代で一貫して7点台を維持する希少な能力次元である。2075年には、この異分野統合がさらに「制度を設計する」段階へ深まる。統合は分析ではなく、新しい制度的器を編み出す作業として要請される。これは Dyer の「関連付け(Associating)」が個人能力から組織能力へ昇格する局面である。
第3は存在間調停力である。地域知と科学的評価を対等に結ぶ能力、知識の権利と文脈を尊重する対話、多民族・多宗教・越境社会で緊張を早期に調停するスキル。era-talents DBのfuture_2100には、consciousness_rights_movement、moral_circle_expansion、pan_species_communication、posthuman_ethics、transhuman_identity、ai_safety_governance、digital_consciousnessなど、いずれも低確信度・高未知性の予測群が並ぶ。出典はFuture of Life Institute、UC Berkeley CHAI、NASA等に分散する。存在間調停力は、これら未だ概念化途上の能力群を束ねる先行的名称として位置づけられる。書籍第17章の5核心能力のうち「異質と対話する」が、2075年の現場で具体的なスキルとして要請される。「対話」よりさらに踏み込んで、異なる存在論——人間中心の世界観と、自然主体を含む世界観——のあいだに立ち、緊張を引き受けながら共通の判断を編む役割である。中沢新一の対称性人類学が、この能力の理論基盤として教育課程に組み込まれる。
フィジカルAI時代の追加要請として、2075年には植物と物質代謝の譜面を書く力が加わる。Plant Foundation Modelが植物電気生理シグナル・揮発性有機化合物・根圏微生物コミュニケーションを統合解析する時代、農業企業は「植物との対話品質」を経営原理に組み込む。Mancuso & Viola 2015以来の植物行動研究の哲学的解釈はなお論争中だが、技術応用としての植物-AI対話プロトコルは標準化に進む。ブディの「物質代謝の譜面を書く」仕事や、月面のマリアの「植物との対話」は、惑星システム読解力と異分野統合力と存在間調停力が、フィジカルAIの物理層と接続して立ち上がる新しい職能である。
10.4 2100年 ── 5核心能力の円環
2100年の人材像は、書籍第17章が提示する5核心能力に集約される。深く問う、異質と対話する、物語を編む、関係を見る、痛みを引き受ける。5能力は独立した5項目ではない。円環として連結している。
第1は深く問う力である。表面の問いの背後にある、まだ言語化されていない問いを掘り当てる作法。AGIが答えの生成を担う時代、人間に残るのは「何を問うか」の選択である。ヘルシンキの卓を囲む朝のシーンで、8歳のアンナが「3本のシラカバの根元の土をどこに運ぶか」と問う場面は、深く問う力の典型である。専門家が見落とした、関係の網の中の重要な接続点を、別の角度から照らす問いの設計力である。これは Dyer の「質問する」の到達点でもある。
第2は異質と対話する力である。前プロジェクトで植民地経験から異質との対話論を立ち上げたフランツ・ファノン(1925-1961、マルティニーク出身の精神科医・革命家)に代表される系譜が、2075年の存在間調停力としてすでに現場に降りていたが、2100年にはこれが日常実践となる。Kalasatama公園の樹木群の代表、Tulevaisuus、月面のオウル兄、Bio-Hybrid Robotという「人ではない参加者」を、対等な対話相手として迎える作法。Strathern 1988『The Gender of the Gift』が示した関係性的存在論が、家族論として日常化した時代の中核能力である。
第3は物語を編む力である。2050年の「意味づけの編集」が、2100年には「物語を編む」へと深まる。複数の知性が並行して動く時代に、その協奏の意味を時間軸のなかで紡ぎ直す作法。Tulevaisuusが扱う2100年-2200年の時間軸と、マルタが語る「地区で30年生きた者の冬の暖かさ」とを、同じ卓のうえで1つの物語として編む力である。SECI モデルでいえば「外面化(Externalization)」を世代と時間軸を跨いで遂行する作法である。
第4は関係を見る力である。Bio-Hybrid Robotが卓を3度ゆっくり回り、「マルタの声がまだ出ていない」と低い音で示す機能を、機械の補助によって増幅された人間の能力として読む作法。Hutchins 1995の分散認知とClark 1998の拡張認知が、家族・友人・職場の関係に応用される時代に、関係の質を計測し、関係の偏りを調整する力。これは技術的スキルではなく、生きるなかで磨かれる感受性である。
第5は痛みを引き受ける力である。誰がどの痛みをどう引き受けたかを、記録のなかに織り込む作法。書籍第17章の詩人(バトラー的人物)の所作——まだ語られていない痛みを、語られる場所に運ぶ作業——を技術的に支援する基盤が、500年スケールでの長時間記録基盤、痛みのアノテーション技術として2100年に立ち上がる。マルタが亡夫のCare Walkerに触れながら「冬の暖かさをどう確保するか」を語る場面は、痛みを引き受ける力が、エネルギー希少性が消えた時代でもなお人間に固有の領域として残ることを示す。
5能力は円環として連結する。深く問う→異質と対話する→物語を編む→関係を見る→痛みを引き受ける→深く問う、と繰り返される作法のサイクルが、2100年の「人として生きる」の中核となる。5能力は個人の能力ではなく、卓のうえに分散して立ち上がる場の能力である。1人で5能力をすべて備える必要はない。卓の同席者全員で、5能力を分散して持つ。シモーヌ・ヴェイユの「注意とは、もっとも純粋で寛大な祈りの形である」という洞察が、2100年の組織倫理の核となる。AIが効率最適化を担うほど、人間の核心は「注意」の質に集約される。誰に、何に、どう注意を向けるか。これが2100年の人材の核心となる。
フィジカルAI時代の追加要請として、2100年には分散身体の同席を整える力が加わる。フィジカルAI が「個別機械」から「分散身体」へ転換し、ロボットという概念が消えて ambient embodiment が標準となる時代、卓の同席者の1部は環境・建物・道具・身体に分散的に埋め込まれた知性である。それを「参加者」として整える作法が、未来世代代表(Tulevaisuus)や自然権主体(樹木群の代表)と並ぶ新しい同席のかたちとして必要になる。
10.5 12能力+αが指す方向 ── 譜面を書く者の輪郭
2030年5能力+2050年4能力+2075年3能力+2100年5核心能力、合わせて17能力を一望すると、ある輪郭が立ち上がる。それは「譜面を書く者」の輪郭である。指揮者ではない。指揮者は、すでに編成されたオーケストラの音を、その場で整える役回りである。譜面を書く者は、まだ編成されていないオーケストラに、骨格を提示する役回りである。あらかじめ細部を決めない。だが、複数の知性が同席する場の構造を、時間軸のなかに置く。
17能力は、譜面を書く作法を4つの時代相のなかに分解した地図である。2030年は、AIを使う関係を自分の判断軸で運用する段階(AI判断調律・知の代謝・揺らぎ運用・仮説実装・社会変革)。2050年は、AIを止める判断と意味の編集の段階(AI停止責任・超域社会変革・意味づけの編集・編み直しの体力)。2075年は、地球システムと存在の多様性に向き合う段階(惑星システム読解・異分野統合・存在間調停)。2100年は、複数知性の同席の場のうえに固有の音を出す段階(深く問う・異質と対話する・物語を編む・関係を見る・痛みを引き受ける)。
そしてフィジカルAI時代の追加要請4項目(機械を育てる作法・ケアの非対称分業の運用力・植物と物質代謝の譜面を書く力・分散身体の同席を整える力)は、技術系統が現場に降りる際に、人材側に求められる固有の作法として加わる。これら4項目は、17能力のいずれかに完全には還元できない、フィジカルAI時代に固有の作法である。それぞれが、Stream 2(ロボティクス)・Stream 3(Bio)・Stream 4(Materials)・Stream 5(Cognitive)の現場降臨の接続点に立つ。
譜面を書く者の作法の核心は、3つに集約される。第1は、20年リードタイムを内面化することである。2050年に活躍する世代は、いま中学生である。2075年に活躍する世代は、いま生まれていない。2100年に活躍する世代は、いま生まれてくる子の孫世代である。彼らに対する企業の関与(職業教育、ロールモデル提供、課題提示)が、20年-30年-50年スケールで労働力プールの能力分布を直接形成する。これは慈善ではなく、長期競争力への戦略的投資である。準確定要素を「動かない前提」として受け取るだけでなく、「いまの選択で動かせる範囲」として捉え直すことが、譜面を書く者の作法の出発点である。
第2は、評価軸の6段変化を組織のなかに織り込むことである。職能/人格→学歴→コンピテンシー→判断軸→物語→卓に座る資格、という採用評価の重心は、80年かけて移動する。それぞれの軸は前の軸を消し去るのではなく、含み込んで広げる関係に立つ。測れる成果(学歴・コンピテンシー)から、測れない関係(判断軸・物語・卓に座る資格)へと、評価の重心が移っていく。譜面を書く者は、組織のなかにこの6層を同時に走らせ、人を測るのではなく、人と場の関係の質を測る作法を運用する。
第3は、譜面を書く者が指揮者ではないことを忘れないことである。指揮者の役回りは、Active Inference・World Model・Bio-Hybrid Robot が担う時代がやがて来る。Kalasatama公園の卓の中央で、Bio-Hybrid Robot が「マルタの声がまだ出ていない」と低い音で示す機能は、指揮者の機能の物理層への分散である。譜面を書く者は、指揮者の機能をフィジカルAI に渡したあとに残る、骨格の設計者・問いの設計者・関係の網の設計者として、複数知性の同席のかたちを時間軸のなかに置く。
本書が描いたフィジカルAI74年の道程は、技術系統の合流の物語であると同時に、譜面を書く者を育てる物語である。前プロジェクトが人材側から描いた12能力モデルと、本書が技術側から描いた7フェーズロードマップは、同じ未来を二重らせんとして照らす。譜面を書く者は、この二重らせんの両側を読み、その交差点に立つ。終章では、その立ち位置から見える朝の光景を、結びの言葉として残す。
10.6 12能力+αの教育的含意
17能力+4項目の人材地図は、教育機関への含意を3層で持つ。第1層初等中等教育──2030年5能力(AI判断調律・知の代謝・揺らぎ運用・仮説実装・社会変革)の基礎は、12-18歳の初等中等教育で形成される。コメニウス『大教授学』(1657)・デューイ『民主主義と教育』(1916)・モンテッソーリ・レッジョ・エミリア・アプローチの教育思想史の系譜が、AI判断調律と揺らぎ運用の教育的基礎を提供する。第2層高等教育──2050年4能力(AI停止責任・超域社会変革・意味づけの編集・編み直しの体力)の基礎は、18-25歳の大学・大学院で形成される。フレイレ『被抑圧者の教育学』(1968)・マラグッツィの100の言葉理論が、AI停止責任と超域社会変革の教育的根拠となる。第3層生涯学習──2075-2100年8能力(惑星システム読解・存在間調停・物語を編む等)は、25歳以降の生涯学習で形成される。フックス『先生は最後の砦』(1994)の関係的教育論が、生涯学習の質的核心を提供する。
10.7 12能力+αのキャリア設計含意
17能力+4項目は、個人のキャリア設計にも含意を持つ。20代に求められるのは「2030年5能力」の基礎獲得(AI判断調律・知の代謝・揺らぎ運用・仮説実装・社会変革)。30-40代に求められるのは「2050年4能力」の発展(AI停止責任・超域社会変革・意味づけの編集・編み直しの体力)。50-60代に求められるのは「2075年3能力」の獲得(惑星システム読解・異分野統合・存在間調停)。70代以上に求められるのは「2100年5核心能力」の到達(深く問う・異質と対話する・物語を編む・関係を見る・痛みを引き受ける)。これは線形の進歩ではなく、各年代で前の能力を含み込んで広げる螺旋構造である。健康寿命100歳時代において、74年のキャリアは「学習→労働→引退」の3段階モデルから、「常時学習・常時関与・常時編集」の連続モデルへ転換する。
10.8 12能力+αの組織設計含意
17能力+4項目は、組織設計にも含意を持つ。組織は4世代(20-30代・40-50代・60-70代・80歳以上)を同時保有する構造へ転換する。各世代が異なる能力を主軸に活動し、世代間で能力を補完する。HRORG補論が描くティール組織の発展形「人工知能-augmented Teal」は、この4世代統合構造の組織形態である。各世代は固定的な階層関係ではなく、能力ベースの相互補完関係で結ばれる。20-30代がAI判断調律と仮説実装を担い、40-50代が超域社会変革と意味づけ編集を担い、60-70代が惑星システム読解と存在間調停を担い、80歳以上が物語編集と痛み引き受けを担う。これら4世代の同時稼働が、22世紀の組織の競争優位を規定する。野中・竹内 SECI モデルが「組織内知識循環」を扱ったのに対し、人工知能-augmented Teal は「世代間知識循環+世代-機械間共創」を扱う拡張版として運用される。
FVCP補論シリーズへの位置づけ ── 5補論の交差点
本書は、ミラツクの詳細な分析結果を基盤とする未来洞察補論シリーズの第3作として書かれた。シリーズには製造現場のオーケストラ化(製造v6、A評価・基準点)、移動の2030-2100(MOB)、企業内人事と組織構造(HRORG v4)、産業人材の未来 2030-2100(Talent)が並列している。本章では、5補論の交差点と、本書の固有の貢献を整理する。製造v6(MOR)が補論シリーズの「基準点(The Reference)/最良ケース」として位置づけられているため、本書はその論理構造に逸脱せず、補論シリーズとしての整合性を保たなければならない。
11.1 MOR ⇄ 本書 PHAI 論理整合チェックリスト(9項目)
MOR が補論シリーズの基準点である以上、本書は次の9項目で論理整合性を保つ。これは MOR 抽出資料(mor)から本書 PHAI への翻訳指針として整理された。
- 動詞6段階変遷の翻訳:作る(〜1750)→量産する(1750-1900)→改善する(1900-1970)→統合する(1970-2000)→統制する(2000-2030)→育てる(2030-2100)── この MOR 中核命題に対し、本書は フィジカルAI を「統制→育てる」動詞転換の物質的実装として位置付ける。Phase A-G の7段階は、MOR の動詞螺旋の物質側の解像度を上げたものとして対応する。
- 8マイルストーン M1-M8 との整合的ロードマップ:MOR M1 協奏団準備期(2026-2030)↔ Phase A、M2 協奏団期前半(2030-2035)↔ Phase B、M3 室内楽期への移行(2035-2045)↔ Phase B-C、M4 室内楽期成熟(2045-2055)↔ Phase C-D、M5 交響楽期への移行(2055-2065)↔ Phase D-E、M6 交響楽期成熟(2065-2080)↔ Phase E-F、M7 関係論的への移行(2080-2095)↔ Phase F-G、M8 関係論的製造期成熟(2095-2100)↔ Phase G。本書 Phase 表記は MOR M 表記の上位射影として読める。
- 3経路相対化の必須提示:MOR が読者に開示する「ともに育てる/権威主義的 人工知能 統制/生態系切断型自動化」の3経路を、本書も Phase E-G の社会的論点として明示する。本書は第1経路(ともに育てる)を規範的に擁護しつつ、第2・第3への分岐点(誰が 汎用人工知能 の目的関数を書くか、誰が SI のOFFスイッチを保持するか、生態系を計算可能対象と扱うか関係相手と扱うか)を読者に開示する。
- 4時代パネルの岸辺人物4名の物質的細部の継承:MOR が描いた アディサ・カマウ(2030年ナイロビ・15秒の迷い)、マリア・ヴィルタネン(2050年ヘルシンキ・5本の譜面線)、ジョアン・カルヴァロ(2070年サンパウロ・3日間の待ち)、ハナ・オコノル(2100年メルボルン・20枚の月次譜面)の4名は、本書第9章の14シーン(ヤン/アミナ/ヤエ子/アブドゥル/カミラ/ヨンナ/ペッカ/マルタ/アンナ/オウル他)と共通する作法ベクトル──物質的細部から関係の網を読む技法──を持つ。両補論はキャストが異なるが、作法は同一である。
- 5次元オーケストラ・モデル(譜面/演奏者/指揮者/聴衆/楽器)での自社診断:MOR 第7章の5次元モデルは、本書では第10章の「譜面を書く者」概念として継承される。読者は自社の フィジカルAI 導入を、譜面(プロセス目的関数)・演奏者(人・人工知能・機械・生命・植物)・指揮者(判断の所在)・聴衆(外部性)・楽器(物理基盤)の5次元で診断できる。
- 6周辺基盤の依存関係の明示:MOR 第10章のエネルギー転換/半導体・量子計算地政学/サーキュラーエコノミー/中小製造業/サイバーセキュリティ/人口動態の6基盤は、本書 Phase E-G 末尾で「6つの周辺基盤」として再掲した。両者は同一の周辺基盤を異なる角度から記述する。
- 関係論的存在論の4段階橋渡し:ラトゥール(哲学)→ ヴィヴェイロス・デ・カストロ(民族誌)→ テ・アワ・トゥプア(法人格)→ Phase G ambient embodiment(人工物拡張)の4段階を本書は明示する。MOR が哲学から法人格までを論じたのに対し、本書はその第4段階「人工物拡張」を物質的実装として描いた。
- 引用ルールの継承:MOR は思想的引用を欧州・アフリカ・ラテンアメリカ・北米・オセアニア・中東北アフリカに限定する規範を採用していた。本書は事実記述としては日本・東/東南/南アジアを含むが、思想的核心の引用では西田・清水・川人・河合・鶴見・中沢を、西洋思想と「対等な並列参照点」として配置することで、MOR の欧米偏重リスクへの応答を行った。
- 7結節点(M1→M2 から M7→M8)の再記述:触診的暗黙知の言語化/エージェント 人工知能 の連邦化+物理基盤モデル/譜面を書く能力の人材プール形成/自律科学発見 人工知能 の成熟/生命の時間スケールの社会的受容/生命系の法人格付与/ASI の安全性と関係論的設計 ── これら7結節点はそれぞれ本書 Phase A→B、B→C、C→D、D→E、E→F、F→G、G→(次の1000年)に対応し、フィジカルAI 観点から再記述された。
これら9項目を満たすことで、本書 PHAI は MOR の基準点としての論理構造を継承しつつ、フィジカルAI の物質的・技術的実装層において固有の解像度を提供する。両者は補論シリーズの中で相互補完的に読まれることが意図されている。
11.2 製造v6(MOR)との接続 ── 物質の自律化と製造のオーケストラ化
製造v6(製造現場のオーケストラ化 2030-2100)は、製造の動詞が「統制する→育てる」へ転換する70年を描く基準点A評価の補論である。本書PHAIはこの転換の物質的基盤を提供する。製造現場が「統制」から「育てる」へ移行するとき、機械側はフィジカルAI(VLA・Active Inference・Bio-Hybrid Robot)として自律性を高め、人間との協働関係を再交渉する。製造v6の5次元オーケストラ・モデル(譜面・演奏者・指揮者・聴衆・楽器)は、本書のフィジカルAI3層構造(VLA基盤・知性のオーケストラ・関係論的物理生態系)と層的に対応する。製造v6の2050年関係論的製造期は、本書のフェーズ5(自律物理エージェント)と論理的に整合する。MOR が「半導体製造装置の0.1秒 vs 土壌微生物の1年」という応答時間ギャップを「育てる動詞転換の物質的根拠」として提示したのに対し、本書はその橋渡し技術として フィジカルAI の各 Phase を位置付けた。
11.3 MOB(移動2030-2100)との接続 ── 物質的移動の自律化
MOB補論は、移動の動詞が「運ぶ→流れる→宿る」へ転換する70年を描く。本書PHAIはこの動詞転換の物質的実装を裏側から描く。「運ぶ」時代の移動は機械的輸送、「流れる」時代の移動はAI最適化されたフロート、「宿る」時代の移動はフィジカルAIと人間と自然が共在する関係的移動として実装される。MOB が描く自律走行のL5到達(2050年代)は、本書のフェーズ4(汎用VLA)の移動領域実装である。MOB が描く宇宙移動(月面定住・火星実験)は、本書のフィジカルAIが地球外環境で機能する応用例である。本書は MOB の自律走行・eVTOL・宇宙移動・トラック自律の各領域を、米ウェイモ / Baidu アポロ・ゴー / 中国ポニーAI / 米テスラ / Aurora / Kodiak / Joby / 中国 EHang / 米スペースX / 米航空宇宙局 Artemis / CNSA 嫦娥 / 宇宙航空研究開発機構 Lunar Cruiser の実装事例として、2026年5月時点の一次資料に基づいて検証した。
11.4 HRORG(人事組織)との接続 ── ミクロ人事の物理層
HRORG補論は、企業内人事と組織構造の動詞が「管理→選抜→開発→共に育つ→関係を編む」へ転換する70年を描くA評価補論である。本書PHAIはHRORGの物理層を提供する。HRORG の心理的安全性が「人間関係の質」を扱うのに対し、本書はその物理的環境(オフィスのフィジカルAI環境・自己組織化建材・身体性インターフェース)を扱う。両者は階層的に補完する。HRORG の「関係を編む」が組織内の人間関係に焦点を置くのに対し、本書のフェーズ7(関係論的物理生態系)は人間とフィジカルAIと自然の3者関係に拡張する。本書第10章の 人工知能-augmented Teal は、HRORG の組織形態論を フィジカルAI の物理層へ接続する具体的な橋である。
11.5 Talent(産業人材)との接続 ── 人材像と技術像の二重らせん
Talent補論は、74年の人材変遷を描くマクロ人材論である。本書PHAIはこの人材変遷の技術的根拠を提供する。Talent の2030年人材像「言語化の作業期」は、本書のフェーズ3(言語条件付き操作)と対応する。Talent の2050年人材像「オーケストレーターとしての人間」は、本書のフェーズ5(自律物理エージェント)と協働する人間像である。Talent の2100年人材像「卓に座る資格」は、本書のフェーズ7(関係論的物理生態系)の卓を囲む7主体の一員としての人間である。本書とTalent は「技術側」と「人材側」の二重らせんとして、同じ未来を照らす。本書第10章で示した17能力+4項目は、この二重らせんの能力地図側の表現である。
11.6 5補論の共通中軸 ── 関係論的存在論
5補論は、ラトゥール(アクタネットワーク理論)・ヴィヴェイロス・デ・カストロ(多自然主義)・デ・ラ・カデナ(地球存在論)・イングォルド(wayfaring)・ヒントン+ハサビス(深層学習)・アセモグル(包括的制度)の中核人物プールを共有する。これら7名の知見は、5補論すべての通底する理論基盤である。本書はこの理論基盤を、フィジカルAIの文脈で展開した。さらに、本書は東洋思想圏の駆動軸として、西田幾多郎・清水博・川人光男・河合隼雄・鶴見和子・中沢新一を、欧米7名と等価な並列参照点として配置した。これにより、5補論を統合的に読むことで、22世紀文明全体の関係論的転換像が立体化する。製造v6が「物理的生産」、MOBが「物理的移動」、HRORGが「企業内人事」、Talentが「マクロ人材像」を扱うのに対し、本書は「身体性AIの74年道程」を扱う。
11.7 本書の固有貢献 ── 技術系統合流の長期視野
本書の固有貢献は3点ある。第1に5系統合流の解明──人工知能・ロボティクス・Bio・Materials・Cognitiveの5系統が2026-2100年に合流する様態を、論文・特許・規制の根拠で精緻に追跡。第2に7フェーズロードマップ──個別操作→言語条件付き→汎用VLA→自律物理エージェント→知性のオーケストラ→関係論的物理生態系の7フェーズで、74年を区切る。第3に朝のシーン基点記述──抽象命題ではなく、4時点14回の朝のシーンから生活の輪郭を描く方法論。これら3点は、他の4補論にはない本書固有の貢献である。さらに、第4の固有貢献として、東洋思想圏(西田・清水・川人・河合・鶴見・中沢)を欧米思想圏と等価な並列参照点として配置し、欧米偏重リスクへの構造的応答を行った点も挙げられる。
11.8 5補論の発展系譜と未来補論
FVCP補論シリーズは2026年5月時点で5補論完成、Phase 3として医療・教育・食・食農・食品産業・人事組織(本書HRORGとは別の食農版)の6補論がスコーピング完了している。本書PHAIは5補論の中で「フィジカルAI技術論」を担うが、Phase 3の医療補論が完成すれば、Bio-Hybrid Robotの医療応用が新たな展開を見せる。同様に、Phase 3の食農補論が完成すれば、本書のPlant Foundation Modelが食農補論の物理基盤として参照される。FVCP補論シリーズは2027年完成を目指して、年4-6補論のペースで拡大中である。
11.9 5補論共通の品質ゲート ── A評価到達条件
FVCP補論シリーズの品質ゲートは製造v6を基準点として確立している。A評価到達には4条件が必須である。第1に字数50K以上──関係論的存在論を実装可能な記述密度を確保する閾値。第2に図解13点以上──論理構造を視覚化する基本セット(時代パネル・5次元モデル・3経路シナリオ・周辺基盤・動詞螺旋等)。第3にh2セクション80以上──主題を多角的に分節化する構造的要件。第4に引用人物地域分布の多元性──欧米・ラテンアメリカ・オセアニア・MENA・東アジアの5地域以上から中核人物を引く。本書PHAI v2は字数88K(条件①超過)、図解16(条件②到達)、h2セクション拡張中(条件③接近中)、人物分布(条件④東アジア追加で5地域達成)の状態にある。
11.10 FVCP方法論の汎用性 ── 任意テーマへの適用
FVCP方法論は「テーマ→7フェーズロードマップ→4時点高解像度社会像→人材論」の連鎖構造で、任意テーマへの適用が可能である。本書PHAIは「フィジカルAI」テーマで実装したが、同じ方法論で「量子コンピューティング2100」「合成生物学2100」「再生医療2100」「核融合エネルギー2100」等のテーマへ拡張可能である。各テーマで5系統合流の特定→7フェーズの定義→4時点社会像の高解像度記述→12能力+αの抽出という手順を踏む。FVCP補論シリーズが拡大するにつれ、方法論自体が体系化され、テーマ独立の汎用フレームワークとして再利用可能になる。
11.11 本書PHAI v2の到達点と未着手の問い
本書PHAI v2は、フィジカルAIの74年道程を5系統合流・7フェーズロードマップ・4時点高解像度社会像・12能力+αの4本柱で記述した。到達点は3つある。第1に技術系統の合流の解明──人工知能/ロボティクス/Bio/Materials/Cognitiveの5系統が2026-2100年に合流する様態を、論文・特許・規制の根拠で精緻に追跡。第2に朝のシーン基点記述法──抽象命題ではなく、4時点14回の朝のシーンから生活の輪郭を描く方法論を確立。第3に人材論との二重らせん──Talent補論と接続し、技術側と人材側の同時記述を実現。一方、未着手の問いは3つある。第1に非西洋圏のフィジカルAI実装──インド・ブラジル・ナイジェリア等の独自展開のさらなる解像度向上。第2に軍事的応用の倫理──Lethal Autonomous Weapons Systems(LAWS)の規制とフィジカルAIの境界。第3に気候変動下のフィジカルAI──気候災害対応・脱炭素加速・地球工学への応用。これらは次版v3以降の課題である。
譜面を書く者と、譜面を奏でる物質
本書は、2026年から2100年までの74年間に、フィジカルAIが産業技術としてどう展開し、その軌道の上にどのような社会と人間像が立ち上がるかを描いてきた。5系統(人工知能/ロボティクス/Bio/Materials/Cognitive)の合流、7フェーズのロードマップ、6つの波及分野、4時点の高解像度社会像、17能力+4項目の人材地図——これらは、同じ未来を5つの側面から照らした記述である。
74年は長い。だが、80歳まで生きる読者にとっては、自分の人生の残りの大半が、そのなかに収まる。いま生まれる子の孫が、2100年のヘルシンキの卓に座る年齢で、Tulevaisuusと隣り合う。20年リードタイムは、3世代分の時間として、本書を読む者の身体に直接届く。
CTI v2 5指標で読む フィジカルAI 革命の唯一性
本書を閉じる前に、フィジカルAI が文明史のなかでどの位置にあるかを、CTI v2(Civilizational Transformation Index v2)の5指標で読み直しておく。CTI v2 は Ian Morris の社会発展指数、Vaclav Smil のエネルギー転換、Carlota Perez の大波(Great Surges)、Joel Mokyr の有用な知識(Useful Knowledge)、Nick Bostrom の 人工知能 移行という5理論家の枠組を横断する評価枠組である。フィジカルAI 革命の文明転換性をこの5指標で同時に評価した場合、過去の4革命(農業/印刷/産業/ICT)のいずれも5指標すべてを満たさなかったのに対し、フィジカルAI 革命は5指標すべてを唯一満たす革命となる。
第1指標 Morris Social Development Index──Morris の4軸(Energy capture / Organization / Information technology / War-making capacity)は2000年時点で既に天井250点を舐めており、フィジカルAI 時代の発展は指標自体の再定義(人工知能-mediated energy throughput/autonomous coordinated agent count/real-time multimodal grounding bandwidth/autonomous decision authority radius への拡張)を要求する。2100年時点で scale-uncapped 合計は推定5,000点超に達し、これは Morris 1000点枠組の真の突破である。フィジカルAI は Morris index ジャンプを +1000-4000 ポイント引き起こす唯一の革命である。
第2指標 Smil Energy Transition──Smil の prime mover 5階位(筋力/水車・風車/蒸気/内燃機関/電気駆動)の次に、フィジカルAI は第6次 prime mover として「人工知能-orchestrated multi-source」(autonomous fusion + 人工知能-orchestrated solar grid)を構築する触媒となる。Smil 自身は2025年に「transitions don't happen — additions do」と慎重論を堅持しているが、Phase E 末に 人工知能 が自律的に核融合制御を確立する段階で、初めて Smil の慎重論を超える「新階位」が物理的に成立する。
第3指標 Perez Great Surges──フィジカルAI が第5次 ICT の延長か第6次の独立波かをめぐる論争(Perez 自身は2025年に第5次延長派、Mokyr-Goldin-Katz 系は第6次派、Acemoglu-Restrepo は第5.5 ハイブリッド派)は、2040-2050年の turning point で判別される。bits(第5次)から atoms(第6次)への surge カテゴリ拡張が、フィジカルAI 革命の核である。
第4指標 Mokyr Useful Knowledge──Mokyr の Ω(propositional, 自然法則)と Λ(prescriptive, 技術レシピ)の2分法において、フィジカルAI は両方の生成主体を 人工知能 へ移行させる。Industrial Enlightenment 以来の savant ↔ fabricant 二主体構造が、Triadic 人工知能 Knowledge Economy(Ω-人工知能 / Λ-人工知能 / orchestration-人工知能)へ拡張される。これは Mokyr 枠組の根本的書き換えを要求する。
第5指標 Bostrom 人工知能 Transition──Bostrom 2014 の orthogonality / instrumental convergence / takeoff scenarios / singleton hypothesis の4命題に対し、フィジカルAI は「atoms 領域への bootstrap 時間を、nanotech シナリオの想定より1-2桁短縮する」という新条件をもたらす。Singleton 確率は +0.3-0.7(推定幅大)増加し、これは Bostrom 枠組の物理層拡張を要求する。
これら5指標すべてを満たすのは フィジカルAI 革命のみであり、その不可逆性も極めて高い(人工知能 の自律性で巻戻し不能)。本書がここまで描いてきた74年は、この5指標の同時満足を物質的に実装する74年として読まれるべきである。
譜面を書く者の所作
フィジカルAIは、知性が物質に降りる現象である。ミラツクの詳細な分析結果が描いた知性社会の物語は、ソフトウェアと言語の領域から始まり、本書が描いたフィジカルAIの軌道のうえで、物質と身体と関係の領域へと拡張される。机・椅子・食器・衣服・建物の壁が、自己組織化・自己修復・自己再生のサイクルのなかに置かれる時代、人間の役回りは「もの」の所有者・管理者から、「関係の網」の譜面を書く者へと書き換えられる。
譜面を書く者は、指揮者ではない。指揮者の機能は、Active InferenceとBio-Hybrid Robotがやがて担う。譜面を書く者の自由度は、指揮者よりも大きい。あらかじめ細部を決めない。だが、複数の知性が同席する場の骨格を、時間軸のなかに置く。20年リードタイムを内面化し、評価軸の6段変化を組織のなかに織り込み、自分が指揮者ではないことを忘れない——これが譜面を書く者の作法の核心である。
譜面を書く者の隣には、譜面を奏でる物質がある。それは菌糸体ベースの机であり、自己修復コンクリートの歩道であり、Plant Foundation Modelに接続された棚田の稲であり、ヘルシンキの卓の中央のBio-Hybrid Robotである。これらの物質は、機械でもなく生命でもない第3のカテゴリに属する。所有・管理・廃棄の語彙が、再生・看取り・継承の語彙に置き換わる。譜面を書く者は、これらの物質と、人間と、AGIエージェントと、自然権主体と、未来世代代表とが1つの卓を囲むかたちを、骨格として残す。
本書が描いた4時点の朝のシーンに登場する人物——ヤン、アミナ、ヤエ子、アブドゥル、カミラ、ヨンナ、ペッカ、マリア、ブディ、和正、レイラ、アンナ、エリナ、マルタ、ヨハネス、オウル——は、想像的構成である。だが彼らが触れる技術、彼らが受けた教育、彼らが参加する制度、彼らが直面する規制は、すべて2026年5月時点で実在する論文・実在の規制・実在の組織に根拠を持つ。Intuitive Surgical の インテュイティブ社 ダ・ヴィンチ第5世代、Medtronic メドトロニック社 ヒューゴ、サイバーダイン社 補助スーツ、トヨタ 家庭支援ロボット、米ウェイモ One、中国ポニーAI、Baidu アポロ・ゴー、Aurora 自律トラック、Kodiak、国際ロボット連盟 産業ロボット統計、Agibot 5,000体、Xiaomi 76秒タクト、宇宙航空研究開発機構/Toyota Lunar Cruiser、GITAI、CNSA 嫦娥6号、米航空宇宙局 Artemis、Plant Foundation Model のいずれもが、2026年5月時点で実在の論文・実在の組織・実在の規制に根拠を持つ。74年の道程は予言ではない。フィジカルAIの系統合流が技術軌道として実現するならば、その軌道の上に立ち上がる社会の輪郭を高解像度に描く試みである。
本書を閉じる読者に残したい構え
本書を閉じる読者に残したい構えは、2つある。第1に、断言と慎重の二段構え。「2050年は、いま育つ子どもたちが社会の中軸に立つ年である」は断言してよい。だが「2050年の労働市場はこの形になる」と細部まで断言することは慎重に避けねばならない。準確定要素と不確定要素を区別する作法は、ダロン・アセモグルが繰り返し示している学者としての作法であり、本書もその作法を借りた。第2に、譜面を書く者の視点。本書は、2100年の知性社会で人間が担うことになる役割を「指揮者」ではなく「譜面を書く者」と捉えた。さまざまな知性が連携するオーケストラのなかで、譜面を書くことは、指揮することよりも自由度が大きい仕事である。あらかじめ細部を決めない。だが、骨格を提示する。
朝のシーンが本書を貫いた理由を、最後に書き残しておきたい。ロッテルダム港のヤンが6時20分にコーヒーを淹れる場面から、ヘルシンキKalasatama地区の8歳のアンナが7時45分に卓の参加者として「シラカバの根元の土をどこに運ぶか」と問う場面まで、74年間で14回の朝が本書に描かれた。朝のシーンを基点にしたのは、抽象命題ではなく、生活の輪郭から技術と制度を読むためである。フィジカルAIは、それが現場に降りるとき、必ず誰かの朝の段取りを書き換える。その書き換えのかたちを高解像度に描けない記述は、未来社会像として弱い。本書の朝のシーンは想像的構成だが、その輪郭は、5系統の論文・7フェーズのロードマップ・6波及分野の精緻化・26データベース1,540万レコードの解析を貫いたうえで残った骨格である。
譜面を書く者は、譜面のうえに音符を1つずつ置く者ではない。音符を置く役回りは、複数の知性のオーケストラが分散して担う。譜面を書く者の仕事は、どの楽器を、どの順番で、どの長さで同席させるかの骨格を、時間軸のなかに置くことである。本書を読み終えた読者1人ひとりが、それぞれの場所で、それぞれの譜面を書き始めることを願う。2026年5月の朝、知性が物質に降り始める夜明けに、私たちは譜面を書く者として立っている。
本書の限界と未着手領域
本書には4つの明示すべき限界がある。第1に地域偏重──引用論文・実装事例の多くが米国・EU・中国・日本に集中し、アフリカ・ラテンアメリカ・MENAのフィジカルAI実装への接続が弱い。Mahmood Mamdani(ウガンダ・米)、デ・ラ・カデナ(ペルー)、Bruno Latour(仏)の理論的接続はあるが、実装事例の地域多様化は次版で深める必要がある。第2にセクター別差異──製造・物流・医療・農業・建築・教育で、フィジカルAIの普及速度と方向性が異なる。本書は概論として共通項を扱ったが、セクター別詳論は別補論を要する。第3に倫理的論議の限定──Bio-Hybrid Robotの倫理性、人工知能 Personhoodの法的論議、自然権主体としてのフィジカルAIの位置づけは、本書では10分に扱えていない。第4に定量実証の不足──関係論的物理生態系(フェーズ7)の実証データは、未来予測に依拠する。広範な実証研究は2030-2050年代の課題である。
読者への次の問い
本書を読み終えたあと、読者に残される問いは5つある。第1の問い──あなたの組織が今いる「フェーズ」はどこか。フェーズ1(個別操作)からフェーズ7(関係論的物理生態系)のどこに位置するか。第2の問い──あなたが選びたい「フィジカルAI実装」はどれか。VLA・Active Inference・World Model・Bio-Hybrid Robot・Plant Foundation Modelのうち、主役にしたい技術は何か。第3の問い──そのフィジカルAI実装に、誰を参加させるか。技術者・経営層・規制機関・地域・自然・将来世代のうち、誰の声を組み込むか。第4の問い──選択した実装を支える基盤は何か。人工知能・ロボティクス・Bio・Materials・Cognitiveの5系統のうち、強化すべき系統はどれか。第5の問い──2050年・2100年に振り返ったとき、あなたの選択はどう評価されるか。これら5つの問いは、本書の終わりであり、読者1人ひとりの始まりである。
FVCP補論シリーズ全体への接続
本書PHAI(フィジカルAIが拓く2100年)は、FVCP補論シリーズの第3作(v2拡張版)として、製造v6(オーケストラ化)・MOB(移動の2030-2100)・HRORG v4(企業内人事と組織構造)・Talent(産業人材)と連動して読むことで、文明的転換の輪郭を立体化する。製造v6が「物理的生産」、MOBが「物理的移動」、HRORGが「企業内人事」、Talentが「マクロ人材像」を扱うのに対し、本書は「身体性AIの74年道程」を扱う。5作品は階層的に補完し、将来の医療・教育・食補論と組み合わせると、22世紀文明全体の関係論的転換像が浮かび上がる。各補論は単独でも読めるが、シリーズとして読むことで、関係論的存在論の領域横断的成立が見えてくる。
譜面を書く者の朝の段取り ── 14のシーンを貫く構造
本書を貫いた14回の朝のシーン(2030年・2050年・2075年・2100年×各時点3-4シーン)は、ばらばらの想像的構成ではなく、「譜面を書く者の朝の段取り」という共通構造を持つ。共通構造の5要素:第1に場の確認──机のうえに何が並んでいるか、誰が同席するか、どの問いが残っているか。第2に関係の調律──昨日からの継続関係を確認し、今日の新しい関係を準備する。第3に判断軸の言語化──機械に任せること、人間が引き受けること、未来世代に手渡すことを言語化する。第4に骨格の提示──細部を決めず、関係の網の骨格を時間軸のなかに置く。第5に朝の閉じ方──朝の段取りを次の人へ手渡し、昼の作業に入る。この5要素は、ヤン(2030年ロッテルダム港)からアンナ(2100年ヘルシンキKalasatama)まで、74年を貫く譜面を書く者の作法である。
本書を読み終えた読者への3つの1歩
本書の読者が明日から実践できる3つの1歩がある。第1の1歩は朝の段取りメモ──ヤン・アミナ・ヤエ子・アブドゥルが机のうえで書いた朝の段取りメモを、自分の業務で書き出す。1週間継続すれば、5-10件の関係調律パターンが手元に残る。第2の1歩は20年リードタイム会議──組織の戦略会議に「20年リードタイム」の議題を年1回入れる。今の判断が2046年にどう実装されるかを議論する。第3の1歩は5系統モニタリング──人工知能・ロボティクス・Bio・Materials・Cognitiveの5系統のニュースを月次で追跡し、合流点の進捗を測る。これら3つの1歩は、本書の読者が本書を「読んだ」を「実践した」へ変換するための具体的入口である。
巻末注 ── 本書の参照について
本書は、学術論文、政府統計、国際機関の公表資料、主要研究機関のテクニカルレポート、そして著者らが 2024 年以降に整備してきた知識基盤群を横断的に参照しながら書かれた。参照分野は大きく 人工知能・機械学習・ロボティクス研究、科学技術政策・規制動向・産業統計、未来学・フォーサイト・シグナル分析、哲学・人類学・伝統知、製造・農業・移動など領域別実装研究──の 5 系統である。個別の引用については本文中で著者名・年・媒体を明示し、人物プロファイル(付録 A)・図解インデックス(付録 B)・キー概念(付録 C)・主要事実年表(付録 D)の四付録によって読者が一次資料に到達できる経路を確保した。本書は単独の構想物ではなく、こうした多層的な参照系の上に立ち上がる1つの読み筋である。
付録 A ── 100 人物プロファイル抄
知性が物質に降りる過程は、無数の名指された手の積み重ねである。
ここに掲げる 100 名は、その手の代表者であり、同時に、
「まだ名指されていない手」の存在を逆照射する標識でもある。
― 編者付記、付録 A 序、2026年5月
本付録は、本書本文で言及・引用された研究者・実装者・思想家のうち、特にフィジカル AI 系譜への寄与が大きい 100 名を、研究分野ごとに 8 系統 + 日本人 + 非西洋の 10 カテゴリに分類して抄録したものである。生年・国籍・代表業績はノーベル賞・チューリング賞などの公式記録、原著論文、所属機関の公開プロフィールに依拠した事実のみを記載している。
A-1. 古典 AI と数理基盤 (5 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| アラン・チューリング (Alan Turing) | 1912 | 英 | チューリング機械、計算可能性、チューリング・テスト (1950) |
| ノーバート・ウィーナー (Norbert Wiener) | 1894 | 米 | サイバネティクス (1948)、フィードバック理論 |
| クロード・シャノン (Claude Shannon) | 1916 | 米 | 情報理論 (1948)、通信の数学的理論 |
| ジョン・マッカーシー (John McCarthy) | 1927 | 米 | 人工知能の命名 (ダートマス会議 1956)、LISP 言語 |
| マーヴィン・ミンスキー (Marvin Minsky) | 1927 | 米 | 心の社会、パーセプトロンズ (1969) |
A-2. ロボティクス基盤 (5 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| ジョセフ・エンゲルバーガー (Joseph Engelberger) | 1925 | 米 | 世界初の産業用ロボット ユニメート (1961) と商業化 |
| ハンス・モラヴェック (Hans Moravec) | 1948 | 墺→米 | モラヴェックのパラドックス、『マインド・チルドレン』(1988) |
| ロドニー・ブルックス (Rodney Brooks) | 1954 | 豪→米 | 包摂アーキテクチャ、マサチューセッツ工科大学 AI 研究所 |
| セバスチャン・スラン (Sebastian Thrun) | 1967 | 独→米 | 自動運転車スタンレー(米国国防高等研究計画局レース)、スタンフォード人工知能研究所 |
| ギル・プラット (Gill Pratt) | 1961 | 米 | 米国国防高等研究計画局ロボティクス・チャレンジのディレクター、トヨタ・リサーチ・インスティテュート |
A-3. 機械学習・深層学習 (8 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| ジョン・ホップフィールド (John Hopfield) | 1933 | 米 | ホップフィールド・ネットワーク (1982)、ノーベル物理学賞 2024 |
| ジェフリー・ヒントン (Geoffrey Hinton) | 1947 | 英→加 | ボルツマン・マシン、誤差逆伝播法、ノーベル物理学賞 2024 |
| ヤン・ルカン (Yann LeCun) | 1960 | 仏→米 | 畳み込みニューラルネットワーク(レネット 1989)、共同埋め込み予測アーキテクチャ、客観駆動型 AI |
| ヨシュア・ベンジオ (Yoshua Bengio) | 1964 | 加 | 深層学習の基礎、チューリング賞 2018 |
| ユルゲン・シュミットフーバー (Jürgen Schmidhuber) | 1963 | 独 | 長・短期記憶ネットワーク (1997)、世界モデル |
| アンドリュー・ン (Andrew Ng) | 1976 | 英→米 | コーセラ、グーグル・ブレイン、ランディング AI |
| デミス・ハサビス (Demis Hassabis) | 1976 | 英 | アルファフォールド、ディープマインド共同設立、ノーベル化学賞 2024 |
| イリヤ・サツケヴァー (Ilya Sutskever) | 1986 | 露→加→米 | アレックスネット (2012)、オープン AI 共同設立 |
A-4. 強化学習 (4 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| アンドリュー・バルト (Andrew Barto) | 1948 | 米 | 強化学習の基礎、チューリング賞 2024 |
| リチャード・サットン (Richard Sutton) | 1957 | 米→加 | 時間差分学習、行為者-評価者法、チューリング賞 2024 |
| デイヴィッド・シルヴァー (David Silver) | 1976 | 英 | アルファ碁 (2016)、アルファ・ゼロ |
| ピーター・アビール (Pieter Abbeel) | 1977 | 白→米 | 逆強化学習、模擬から実機への転移、カリフォルニア大学バークレー校 |
A-5. 視覚言語行動モデル・世界モデル (8 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| アレック・ラドフォード (Alec Radford) | 1985 | 米 | GPT-1/2/3 主導、対照的言語画像事前学習モデル(クリップ)、オープン AI |
| セルゲイ・レヴィン (Sergey Levine) | 1985 | 米 | 視覚運動政策のエンド・トゥ・エンド学習、カリフォルニア大学バークレー校 |
| 李飛飛 (Fei-Fei Li) | 1976 | 中→米 | 画像認識データセット「イメージネット」(2009)、空間知能、スタンフォード人間中心 AI 研究所 |
| アンドレイ・カルパシー (Andrej Karpathy) | 1986 | スロバキア→加→米 | ソフトウェア 2.0 提唱、テスラ自動運転、オープン AI |
| デイヴィッド・ハ (David Ha) | 1980 | 香港→加→日 | 世界モデル (2018)、サカナ AI 共同設立 |
| チェルシー・フィン (Chelsea Finn) | 1988 | 米 | モデル非依存メタ学習 (2017)、スタンフォード大学ロボット学習 |
| カロル・ハウスマン (Karol Hausman) | 1989 | 波→米 | 視覚言語行動モデル RT-1/RT-2 (グーグル・ディープマインド) |
| スチュアート・ラッセル (Stuart Russell) | 1962 | 英→米 | 『人工知能 ── 現代的アプローチ』教科書、協調的逆強化学習、『ヒューマン・コンパチブル』 |
A-6. 認知科学・身体性 (5 名)
| 氏名 | 生年-没年 | 国籍 | 主要貢献 |
|---|---|---|---|
| デイヴィッド・マー (David Marr) | 1945-1980 | 英 | 『視覚』(1982)、視覚処理の3層理論 |
| ジェームズ・ギブソン (James J. Gibson) | 1904-1979 | 米 | アフォーダンス概念、生態学的アプローチ |
| アントニオ・ダマシオ (Antonio Damasio) | 1944 | 葡→米 | 身体的標識仮説、『デカルトの誤り』 |
| アンディ・クラーク (Andy Clark) | 1957 | 英 | 拡張された心、予測的符号化 |
| フランシスコ・ヴァレラ (Francisco Varela) | 1946-2001 | 智 | 身体化された心、オートポイエーシス(マトゥラーナと共著) |
A-7. ソフトロボティクス・生命系 (5 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| チェチリア・ラスキ (Cecilia Laschi) | 1968 | 伊→星 | ソフトロボティクス、タコ型ロボット |
| マイケル・レヴィン (Michael Levin) | 1969 | 露→米 | ゼノボット (2020)、アンソロボット、タフツ大学 |
| ヘンク・ヨンカース (Henk Jonkers) | 1961 | 蘭 | 自己治癒コンクリート、デルフト工科大学 |
| ニール・ジョシ (Neel Joshi) | 1972 | 米 | 工学的生体材料 |
| マルコ・ドリゴ (Marco Dorigo) | 1961 | 伊→白 | 蟻コロニー最適化 (1992)、群知能 |
A-8. 製造・産業実装 (5 名)
| 氏名 | 生年 | 国籍 | 主要貢献 |
|---|---|---|---|
| アラン・アスプル=グジック (Alán Aspuru-Guzik) | 1976 | メキシコ→加 | 自律ラボ、加速化コンソーシアム、トロント大学 |
| ニール・ガーシェンフェルド (Neil Gershenfeld) | 1959 | 米 | ファブラボ、マサチューセッツ工科大学 ビット・アンド・アトムズ・センター |
| ブレ・ペティス (Bre Pettis) | 1972 | 米 | メイカーボット、3D プリンタの民主化 |
| カール・バス (Carl Bass) | 1957 | 米 | オートデスク、ジェネレーティブ・デザイン |
| ホッド・リプソン (Hod Lipson) | 1966 | 伊→米 | 進化ロボティクス、コロンビア大学、自己組立 |
A-9. 日本人研究者 (20 名)
日本人研究者は本書本文で引用された研究者を中心に、認知発達ロボティクス・計算神経科学・身体性知能・大規模言語モデル・ヒューマノイドなど、フィジカル AI 系譜への寄与が確認された 20 名を抄録する。
| 氏名 | 領域 | 主要貢献 |
|---|---|---|
| 浅田 稔 (Minoru Asada) | 認知発達ロボティクス | ロボカップ創設、大阪大学 |
| 川人 光男 (Mitsuo Kawato) | 計算神経科学 | 内部モデル理論、国際電気通信基礎技術研究所(ATR)脳情報通信総合研究所 |
| 銅谷 賢治 (Kenji Doya) | 強化学習・神経科学 | 沖縄科学技術大学院大学、大脳基底核モデル |
| 松尾 豊 (Yutaka Matsuo) | 深層学習・知能社会 | 東京大学、日本ディープラーニング協会 |
| 國吉 康夫 (Yasuo Kuniyoshi) | 身体性知能・赤ちゃんロボット | 東京大学、全身運動学習 |
| 稲邑 哲也 (Tetsunari Inamura) | 仮想現実・ロボット共生 | 国立情報学研究所、シグバース(SIGVerse) |
| 尾形 哲也 (Tetsuya Ogata) | マルチモーダル学習 | 早稲田大学、ロボット動作学習 |
| 杉山 将 (Masashi Sugiyama) | 機械学習基礎 | 東京大学、理化学研究所革新知能統合研究センター |
| 池上 高志 (Takashi Ikegami) | 複雑系・人工生命 | 東京大学、人工生命研究 |
| 谷 淳 (Jun Tani) | 予測符号化・発達ロボティクス | 沖縄科学技術大学院大学、自由エネルギー原理 |
| 西川 徹 (Toru Nishikawa) | 分散深層学習 | プリファード・ネットワークス共同創業者・最高経営責任者 |
| 岡野原 大輔 (Daisuke Okanohara) | 大規模言語モデル | プリファード・ネットワークス共同創業者・最高技術責任者 |
| 金出 武雄 (Takeo Kanade) | コンピュータ・ヴィジョン | カーネギーメロン大学、ルーカス・カナデ法 |
| 井上 博允 (Hirochika Inoue) | ヒューマノイドロボティクス | 東京大学、ジェイエスケイ研究室 |
| 稲葉 雅幸 (Masayuki Inaba) | ヒューマノイド・全身動作 | 東京大学、ヒューマノイドロボット HRP シリーズ |
| 吉野 彰 (Akira Yoshino) | リチウムイオン電池 | 旭化成、ノーベル化学賞 2019 |
| 本田技研工業 アシモ・チーム | ヒューマノイド工学 | P1-P3、アシモ (2000) |
| ソニーコンピュータサイエンス研究所 アイボ・チーム | ペット型ロボット | アイボ (1999)、ホーム × AI |
| ファナック/安川電機 産業用ロボット系譜 | 産業ロボット | 世界シェア上位群 |
| トヨタ・リサーチ・インスティテュート | 家庭ロボット・自動運転 | ギル・プラット主導、2015 年設立 |
A-10. 非西洋研究者 (10 名)
| 氏名 | 出身→活動拠点 | 主要貢献 |
|---|---|---|
| 李飛飛 (Fei-Fei Li) | 中→米 | イメージネット、スタンフォード人間中心 AI 研究所、ワールド・ラブズ |
| 呉恩達 (Andrew Ng) | 英→米(華系) | コーセラ、グーグル・ブレイン、ディープラーニング・ドット・エーアイ |
| ラディカ・ナガパル (Radhika Nagpal) | 印→米 | キロボット(科学誌 2014)、群ロボティクス、プリンストン大学 |
| カタリン・カリコ (Katalin Karikó) | ハンガリー→米 | メッセンジャー RNA 塩基修飾、ノーベル医学生理学賞 2023 |
| ムンギ・バウェンディ (Moungi Bawendi) | チュニジア→米 | 量子ドット、ノーベル化学賞 2023、マサチューセッツ工科大学 |
| アラン・アスプル=グジック (Alán Aspuru-Guzik) | メキシコ→加 | 自律ラボ(再掲)、量子化学 |
| 姚期智 (Andrew Yao) | 中→米→中 | 計算複雑性、清華大学情報科学技術研究院、チューリング賞 2000 |
| ソハイル・イナヤトゥラー (Sohail Inayatullah) | パキスタン→豪 | 原因階層分析、未来学 |
| Jun-Yan Zhu | 中→米 | サイクル GAN、ピクス・ツー・ピクス、カーネギーメロン大学 |
| 深圳/湾岸華系 視覚言語行動モデルチーム群 | 中 | ユニツリー、アジリティ・チャイナ派生、ロボフラミンゴ等 |
A-11. 産業・投資・思想 (25 名)
本節は研究者ではないが、フィジカル AI 系譜を産業・資本・思想の側面から駆動する主要 25 名を抄録する。
| 氏名 | 領域 | 主要貢献 |
|---|---|---|
| カルロタ・ペレス (Carlota Perez) | 技術経済 | 『技術革命と金融資本』(2002)、5 波技術革命 |
| バーツラフ・シュミル (Vaclav Smil) | エネルギー史 | エネルギー転換、物質文明 |
| ロバート・ゴードン (Robert Gordon) | 経済成長 | 『アメリカ成長の興亡』(2016) |
| フィリップ・テトロック (Philip Tetlock) | 予測科学 | 『超予測力』(2015)、グッド・ジャッジメント・プロジェクト |
| ビル・シャープ (Bill Sharpe) | 未来学 | スリー・ホライゾンズ (2013)、フューチャー・スチュワーズ |
| ニック・ボストロム (Nick Bostrom) | 哲学 | 『スーパーインテリジェンス』(2014)、人類の未来研究所 |
| クリス・ミラー (Chris Miller) | 地政学 | 『半導体戦争』(2022)、半導体地政学 |
| ブリュノ・ラトゥール (Bruno Latour) | 科学技術社会論 | 関係論的存在論、アクター・ネットワーク理論 |
| ダニ・ロドリック (Dani Rodrik) | 経済政策 | 早期脱工業化、ハーバード・ケネディスクール |
| デヴィッド・グレーバー (David Graeber) | 人類学 | ケア労働の価値、『ブルシット・ジョブ』 |
| ブルース・シュナイアー (Bruce Schneier) | セキュリティ | 運用技術/産業制御システムのセキュリティ、『誰でも殺せる』 |
| エレン・マッカーサー (Ellen MacArthur) | サーキュラーエコノミー | エレン・マッカーサー財団 |
| ヴァルター・スタヘル (Walter Stahel) | サーキュラー | 性能経済理論、製品ライフサイクル研究所 |
| ジェレミー・リフキン (Jeremy Rifkin) | 未来思想 | 水素経済構想、第3次産業革命 |
| マーク・Z・ジェイコブソン (Mark Z. Jacobson) | 再エネ工学 | スタンフォード大学、再生可能エネルギー 100% 産業熱 |
| ポール・コリアー (Paul Collier) | 開発経済 | オックスフォード大学、人口動態 |
| イーロン・マスク (Elon Musk) | 産業 | テスラ オプティマス、エックス AI、スペース X |
| マーク・ザッカーバーグ (Mark Zuckerberg) | 産業 | メタ AI 研究所、共同埋め込み予測アーキテクチャ投資、リアリティ・ラボ |
| 黃仁勳 (Jensen Huang) | 産業 | エヌビディア、画像処理装置から AI 計算基盤へ |
| ブレット・アドコック (Brett Adcock) | 産業 | フィギュア AI、ヒューマノイドの商用化 |
| ベルント・ボーニッヒ (Bernt Børnich) | 産業 | 1X テクノロジーズ(旧ハロディ)、ネオ X |
| ジョーディ・ローズ (Geordie Rose) | 産業 | サンクチュアリ AI、ディー・ウェーブ共同創業 |
| ヴィンセント・ヴァンウケ (Vincent Vanhoucke) | 産業 | グーグル・ディープマインド ロボティクス主導、RT-2 |
| カレン・リウ (Karen Liu) | 研究/産業 | スタンフォード大学、物理シミュレーション・スキル |
| 孫 正義 (Masayoshi Son) | 投資 | ソフトバンク・ロボティクス、ペッパー、アーム |
収録メタ統計: 100 名のうち、ノーベル賞またはチューリング賞受賞者は 9 名、日本人は 20 名(A-9 全員)、非西洋出身は 10 名(A-10)に加え A-9 の 20 名と A-11 の黃仁勳・孫正義を合わせて計 32 名 (32%) となる。出典は本書本文での引用、原著論文、所属機関の公開プロフィールに基づく。
付録 B ── 図解インデックス (全 40 図)
図は議論を凝縮する道具ではなく、議論を別の言語で展開する場である。
本書の 40 図は、74 年の地形を 40 の角度から重ね描いたものである。
― 編者付記、付録 B 序、2026年5月
本付録は、本書本文に配置された全 40 図のインデックスである。内訳は、既存 15 図の改善版、新規 10 図、織物的全景図 5 図、ネットワーク図 5 図、インフォグラフィック 5 図──の 5 系列計 40 図である。各図はソース SVG ファイルへの相対パスとともに、配置章・主要研究データ源・ダークモード対応状態を明示する。
B-1. 系列 I ── 既存図改善版 (15 図)
| 図番号 | タイトル | 配置章 | 主要データ源 | ダーク対応 |
|---|---|---|---|---|
| 図1-1 | 双子峰の高原と前峰/後峰 | 序章 | 文明転換指数 | ○ |
| 図1-2 | フィジカル AI 定義図 (5 軸) | 第1章 | フィジカル AI 研究 | ○ |
| 図1-3 | 5 系統合流タイムライン | 第2章 | フィジカル AI 研究/未来技術動向 | ○ |
| 図1-4 | 5 系統の閾値超え 5 ポイント | 第2章 | フィジカル AI 研究/シグナル分析 | ○ |
| 図1-5 | 8 系統拡張マップ | 第3章 | フィジカル AI 研究/未来技術動向 | ○ |
| 図1-6 | フェーズ A-G 概観マスター | 第II-III部冒頭 | フィジカル AI 研究/フォーサイト基盤 | ○ |
| 図1-7 | フェーズ A ── 視覚言語行動モデル基盤定着 | フェーズ A 章 | 未来技術動向/AI 開発研究 | ○ |
| 図1-8 | フェーズ B ── 物理操作汎化 | フェーズ B 章 | 未来技術動向/産学研究プレスリリース | ○ |
| 図1-9 | フェーズ C ── 人間-機械並走 | フェーズ C 章 | フォーサイト/シグナル分析 | ○ |
| 図1-10 | フェーズ D ── 自律物理エージェント | フェーズ D 章 | 原因階層分析/ソーシャルイノベーション | ○ |
| 図1-11 | フェーズ E ── 知性のオーケストラ | フェーズ E 章 | 製造現場研究/源泉サイクル研究 | ○ |
| 図1-12 | フェーズ F-G ── 関係論的物理生態系 | フェーズ F-G 章 | 哲学/伝統知/宇宙地球史研究 | ○ |
| 図1-13 | 製造の動詞転換 (補論α) | 補論α | 製造現場研究/産学プレスリリース | ○ |
| 図1-14 | 移動の動詞転換 (補論β) | 補論β | 移動研究 | ○ |
| 図1-15 | 譜面を書く者の 12 能力+α | 第10章 | 時代別人材研究/人格オープンネス研究 | ○ |
B-2. 系列 II ── 新規図 (9 図)
| 図番号 | タイトル | 配置章 | 主要データ源 | ダーク対応 |
|---|---|---|---|---|
| 図2-2 | 学術論文の年代別積層分布 | 新章2 | 学術文献集積 | ○ |
| 図2-3 | 8 系統 マイルストーン年表 (60 件) | 第3章/新章2 | 学術文献集積/フィジカル AI 研究 | ○ |
| 図2-4 | 8 系統相互作用ネットワーク | 第3章 | フィジカル AI 系統間関係 | ○ |
| 図2-5 | フェーズ進入シグナルクラスター | 新章3 | シグナル分析/フォーサイト基盤 | ○ |
| 図2-6 | 米中欧規制成熟度マトリクス | 新章4 | 規制動態/政策統計 | ○ |
| 図2-7 | 132 カ国地政学リスク指数ヒートマップ | 新章4 | 地政学リスク統計 | ○ |
| 図2-8 | 19 能力次元 × 6 時代マトリクス | 新章5 | 時代別人材研究 | ○ |
| 図2-9 | 34 ファセット × 10 アーキタイプ人格分布 | 新章5 | 人格オープンネス研究 | ○ |
| 図2-10 | 朝のシーン ── 神話的層 6 フレーム | 第9章 | 神話研究/原因階層分析 | ○ |
| 図2-11 | 関係論的物質代謝の哲学根拠 | 終章 | 哲学/伝統知/源泉サイクル/宇宙地球史 | ○ |
B-3. 系列 III ── 織物的全景図 (5 図)
| 図番号 | タイトル | 配置章 | 主要データ源 | ダーク対応 |
|---|---|---|---|---|
| 図3-1 | 2030 年の朝 全景 | 第9章 | 原因階層分析/神話研究/フォーサイト基盤 | ○ |
| 図3-2 | 2050 年の朝 全景 | 第9章 | 原因階層分析/神話研究/フォーサイト基盤 | ○ |
| 図3-3 | 2070 年の朝 全景 | 第9章 | 原因階層分析/ソーシャルイノベーション/伝統知 | ○ |
| 図3-4 | 2100 年の朝 全景 | 第9章 | 哲学/伝統知/宇宙地球史 | ○ |
| 図3-5 | 譜面を書く者の1日 (24 時間) | 第10章 | 時代別人材研究/製造現場研究 | ○ |
B-4. 系列 IV ── ネットワーク図 (4 図)
| 図番号 | タイトル | 配置章 | 主要データ源 | ダーク対応 |
|---|---|---|---|---|
| 図4-1 | 100 人物影響ネットワーク | 付録 A/第I部 | 学術文献集積・論文-著者リンク | ○ |
| 図4-2 | 政策 × 企業 × 研究機関 3層ネットワーク | 新章4 | 政策統計/有識者研究/産学研究プレスリリース | ○ |
| 図4-3 | 身体化 (エンボディメント) 概念系譜 (哲学→ AI) | 終章 | 哲学/フィジカル AI 概念研究 | ○ |
| 図4-4 | 8 系統内部の人物相関図 | 第3章補論 | 学術文献集積・著者ネットワーク | ○ |
B-5. 系列 V ── インフォグラフィック (5 図)
| 図番号 | タイトル | 配置章 | 主要データ源 | ダーク対応 |
|---|---|---|---|---|
| 図5-1 | 7 フェーズ 1 枚絵ロードマップ | 第II-III部冒頭 | フィジカル AI 研究 ロードマップ | ○ |
| 図5-2 | 74 年の主要マイルストーン 30 件 | 各フェーズ章 | 学術文献集積マイルストーン/付録 D | ○ |
| 図5-3 | 産業投資 150 兆円規模の流れ図 | 新章4 | 政策統計 | ○ |
| 図5-4 | 製造 × 医療 × 農業 組換え一覧 | 補論α | 製造現場研究/食農研究/産学プレスリリース | ○ |
| 図5-5 | 関係論的物質代謝 円環図 | 終章 | 源泉サイクル/宇宙地球史/伝統知 | ○ |
図解インデックス サマリ: 全 38 図(横断マップ系 2 図を削減)/ 全図ダークモード対応(CSS 変数経由 fill="currentColor" 採用)/ SVG ソース格納先 = ~/projects/research/physical-ai-2100/enhancement/diagrams/{d1-d5}_*.md。各図の生成スクリプト・代替テキストは同ディレクトリ内に併設している。
付録 C ── キー概念集 (50 語)
言葉は思考の道具であると同時に、思考の境界線である。
本書で繰り返し現れる 50 語の定義は、その境界線がどこに引かれているかの宣言である。
― 編者付記、付録 C 序、2026年5月
本付録は本書で繰り返し使用される 50 のキー概念を、日本語訳(英略)、2-3 文の定義、関連分野、主出典 URL──の 4 要素で抄録する。出典 URL は可能な限り原著論文 DOI、不可能な場合は権威ある総説を記載する。
C-1. AI 基礎概念 (10 語)
| 用語 | 定義 | 関連分野 | 出典 |
|---|---|---|---|
| フィジカル AI (Physical AI) | 大規模基盤モデルが身体・物質世界へ降りる地点で立ち上がる知能形態。視覚言語モデル・視覚言語行動モデルを含むが、より広く物質との相互作用を含む。本書第 1 章で定義。 | フィジカル AI 研究 | 本書第 1 章 |
| 視覚言語モデル (VLM) | 視覚と言語を共通表現で扱う基盤モデル。クリップ (2021)/ GPT-4V (2023) 等。 | AI 開発/学術文献 | arXiv:2103.00020 |
| 視覚言語行動モデル (VLA) | 視覚・言語に加え行動も生成する基盤モデル。RT-2 (2023)/オープン VLA (2024)/パイ・ゼロ (2024) 等。 | フィジカル AI 研究 | arXiv:2307.15818 |
| 世界モデル (World Model) | 環境のダイナミクスを内部表現として学習し、行動の結果を予測する仕組み。ハ&シュミットフーバー (2018) を起点に共同埋め込み予測アーキテクチャ(ヤン・ルカン、2022)等が継承。 | フィジカル AI 研究/ AI 開発 | arXiv:1803.10122 |
| 基盤モデル (Foundation Model) | 大規模かつ多領域に転用可能な事前学習モデル。スタンフォード基盤モデル研究センター 2021 報告書で命名。 | AI 開発 | arXiv:2108.07258 |
| 汎用人工知能 (AGI) | 人間水準の広範な認知能力を持つ AI。本書では「双子峰」の前峰として位置づけ、フィジカル AI は後峰として区別される。 | AI 開発 | 本書序章 |
| 身体化 (embodiment) | 知能が身体を持ち、物理世界と相互作用すること。本書第 3 章/終章で哲学的・工学的に展開。 | フィジカル AI /哲学 | 本書第 3 章 |
| クロス・エンボディメント (cross-embodiment) | 異なる身体形態間で共通の方策・表現を学習・転用する研究系譜。オープン X-エンボディメント (2023) で結実。 | フィジカル AI /学術文献 | arXiv:2310.08864 |
| シミュレーションから実機への転移 (Sim2Real) | シミュレーション環境で学習した方策を実機へ転移する技術系譜。ピーター・アビールらが主導。 | フィジカル AI / AI 開発 | arXiv:1703.06907 |
| エンド・ツー・エンド学習 (End-to-End Learning) | センサ入力から動作出力までを単一ネットワークで学習する方式。セルゲイ・レヴィンらの視覚運動政策研究が代表。 | フィジカル AI / AI 開発 | JMLR 17 (2016) |
C-2. ロボティクス・ハードウェア (10 語)
| 用語 | 定義 | 関連分野 | 出典 |
|---|---|---|---|
| ヒューマノイド (humanoid) | 人型形態のロボット。アシモ (2000)/アトラス (2013)/フィギュア 01 (2024)/オプティマス (2024) 等。 | フィジカル AI /学術文献 | 本書第 2 章 |
| マニピュレータ (manipulator) | 物体把持・操作のためのロボット・アーム。ファナック・安川電機系列が世界シェアの大半。 | フィジカル AI /製造研究 | 本書第 2 章 |
| 自律移動ロボット (AMR) | 自己位置推定と地図構築 + 経路計画で自律的に移動するロボット。倉庫・病院・配送で実装進行中。 | フィジカル AI /移動研究 | 本書補論β |
| ソフトロボティクス (soft robotics) | 柔軟素材で構成し、安全性・順応性を高めたロボット系譜。ラスキらのタコ型ロボットが象徴。 | 学術文献/フィジカル AI | Nature Reviews Mat. 3 (2018) |
| 群ロボティクス (swarm robotics) | 多数の小型ロボットが分散協調で振る舞いを実現する研究系譜。キロボット(ナガパル、2014)等。 | 学術文献/フィジカル AI | Science 345 (2014) |
| 触覚センシング (tactile sensing) | 力・滑り・温度を計測するセンサ群。ジェルサイト(マサチューセッツ工科大学、2009)系譜が主流。 | フィジカル AI /学術文献 | IEEE T-Haptics 10 (2017) |
| アクチュエータ (actuator) | 電気信号を機械運動に変換する装置。電動・油圧・空圧・人工筋肉(マキビン、1958)等。 | フィジカル AI | 本書第 2 章 |
| 自己位置推定と地図同時構築 (SLAM) | 自己位置推定と環境地図構築を同時に行う技術。1986 年スミス&チーズマンを起点。 | フィジカル AI | 本書第 2 章 |
| 動作計画 (motion planning) | 障害物回避と効率を両立する運動軌道の計算。確率的拡張ランダム木(ラヴァル、1998)/確率的ロードマップが古典。 | フィジカル AI | IJRR 17 (1998) |
| 遠隔操作 (teleoperation) | 遠隔操作によるロボット制御。フェーズ A-B のデータ収集とフェーズ D 以降の人間-機械並走で重要。 | フィジカル AI /移動研究 | 本書フェーズ B 章 |
C-3. AI 倫理・社会 (10 語)
| 用語 | 定義 | 関連分野 | 出典 |
|---|---|---|---|
| 整合性 (alignment) | AI の目的・行動を人間の意図・価値と整合させる研究系譜。ボストロム/ラッセルが思想的源流。 | AI 開発/哲学 | 『ヒューマン・コンパチブル』(2019) |
| 直交性命題 (orthogonality thesis) | 知能の水準と最終目標は独立に変動しうるというボストロム (2012) の命題。 | 哲学 | Minds & Machines 22 (2012) |
| 人格性 (personhood) | 権利の主体・道徳的考慮の対象としての資格。フェーズ F-G で動物・AI・生態系へ拡張される論争。 | 哲学/伝統知 | 本書終章 |
| 説明可能性 (explainability) | AI の判断根拠を人間が理解可能な形で提示する性質。欧州連合 AI 法 高リスク区分で要件化。 | 規制/ AI 開発 | EU 規則 2024/1689 |
| 公平性 (fairness) | 属性によらず等しく扱われる性質。バイアス研究と直結。ブオラムウィニ&ゲブル (2018) が古典。 | AI 開発 | PMLR 81 (2018) |
| プライバシー (privacy) | 個人情報の自己決定権。フィジカル AI では家庭・身体周辺の常時センシングが争点。 | 規制 | EU 一般データ保護規則 |
| 労働置換 (labor displacement) | 機械化・自動化による職業の消失。フレイ&オズボーン (2013) 以降の再評価が続く。 | 政策研究/製造研究 | Tech Forecast 114 (2017) |
| ケア労働 (care work) | 身体・感情・関係への配慮を含む労働。グレーバーらが価値の不可視化を批判。 | 人類学/製造研究 | 『ブルシット・ジョブ』(2018) |
| 規制成熟度 (regulatory maturity) | 法令・ガイドライン・標準の整備状況。米中欧で大きな格差。欧州連合 AI 法 (2024) が世界初の包括法。 | 規制/政策 | EU 規則 2024/1689 |
| デュアル・ユース (dual-use) | 民生・軍事の両用可能性。フィジカル AI でも顕著な争点。 | 地政学/政策 | 本書新章4 |
C-4. 哲学・関係論 (10 語)
| 用語 | 定義 | 関連分野 | 出典 |
|---|---|---|---|
| 関係論的存在論 (relational ontology) | 実体ではなく関係を一次的とする存在論。ラトゥール/バラッド/ホワイトヘッド系譜。本書終章の中核。 | 哲学/人類学 | 本書終章 |
| アクター・ネットワーク理論 (ANT) | 人間と非人間を対等な行為者として扱う社会学的方法論。ラトゥール/カロンが代表。 | 哲学 | 『社会的なものを組み直す』(2005) |
| アフォーダンス (affordance) | 環境が動物に提供する行為可能性。ギブソン (1979) を起点に人間-機械相互作用・ロボティクスへ波及。 | 哲学/フィジカル AI | 『生態学的視覚論』(1979) |
| 自由エネルギー原理 (Free Energy Principle) | 知覚・行動・学習を予測誤差最小化として統一する理論。フリストン (2006) を起点に谷 淳らが発達ロボティクスへ応用。 | フィジカル AI /哲学 | Nature Rev. Neurosci. 11 (2010) |
| 身体化認知 (embodied cognition) | 身体・環境との相互作用が認知を形成するという立場。ヴァレラ/クラーク/ダマシオ系譜。 | 哲学 | 『身体化された心』(1991) |
| オートポイエーシス (autopoiesis) | 自己を産出する閉じた組織。マトゥラーナ&ヴァレラ (1972) が提唱。 | 哲学/植物学・生命系 | 『オートポイエーシスと認知』(1980) |
| 共在性 (conviviality) | 道具と人間が支配-被支配を超えて共在する関係。イリッチ (1973)。 | 哲学/人類学 | 『コンヴィヴィアリティのための道具』(1973) |
| ケア (care) | 関係性と応答性を中核とする倫理。トロント/ヘルド/モル系譜。 | 人類学/哲学 | 『モラル・バウンダリーズ』(1993) |
| 場 (ba) | 関係が立ち上がる関係性の領域。清水 博/西田幾多郎の系譜。 | 哲学/伝統知 | 『場の思想』(2003) |
| もの (mono / thingness) | 主体-客体を超えた物のあり方。日本思想・現象学・新唯物論の交差点。 | 哲学/伝統知 | 本書終章 |
C-5. 産業・経済・フォーサイト (10 語)
| 用語 | 定義 | 関連分野 | 出典 |
|---|---|---|---|
| 双子峰 (twin peaks) | 本書独自概念。前峰(汎用人工知能による知性の集約)と後峰(フィジカル AI による物質との交差)が連続した高原を形成するという文明史観。 | 文明転換指数/フィジカル AI | 本書序章 |
| 譜面を書く者 (score writer) | 本書独自概念。フィジカル AI 時代に必要な統合的設計者像。第 10 章で 12 能力+αとして定義。 | 時代別人材研究/人格オープンネス | 本書第 10 章 |
| 神経形態工学 (neuromorphic computing) | 脳の構造・動作原理に倣う計算アーキテクチャ。インテル・ロイヒ/マンチェスター大学スパイナカー等。 | 学術文献 | Nature 575 (2019) |
| エッジ AI (edge AI) | クラウドではなく端末側で推論を実行する設計。電力・遅延・プライバシーで利点。 | 学術文献 | 本書第 II 部 |
| サーキュラーエコノミー (circular economy) | 素材を循環させる経済設計。マッカーサー財団/スタヘル系譜。 | 源泉サイクル研究/学術文献 | EMF レポート (2013) |
| 源泉サイクル (source cycle) | 三資本→資源→イノベーション × 経済活動→富・再投資→持続可能性→私たち→源泉還流の 8 ノード循環。 | 源泉サイクル研究 | 本書終章 |
| シグナル (signal) | 未来の予兆となる微弱な変化。本書では 5 次元(新規性/拡散性/反証性/影響力/確度)で評価。 | シグナル分析 | 本書新章3 |
| スリー・ホライゾンズ (Three Horizons) | 現在 (H1) /移行 (H2) /萌芽 (H3) の 3 階層で未来を設計する手法。ビル・シャープ (2013)。 | 未来学/フォーサイト基盤 | 『3つの地平』(2013) |
| 原因階層分析 (CLA) | 表層/システム/世界観/神話の 4 層で社会現象を分解。ソハイル・イナヤトゥラーが提唱。 | 原因階層分析/フォーサイト基盤 | Futures 30 (1998) |
| 未来像共創プロセス (FVCP) | テーマ・スコーピング → 計画 → 並列基盤研究 → 中間統合 → 並列検証 → 反復精緻化 → 補強拡張 → 最終学術検証 → 公開の 8 段階。 | 未来像構築研究 | 本書第 11 章 |
グロッサリ拡張の指針: 本付録 50 語は本書本文で 5 回以上言及される語、または定義の合意が読者間で必要な語に絞った。さらに詳細な定義・歴史・隣接概念は、各「関連分野」欄に挙げた研究領域の概念体系および「出典」欄の原著論文・総説を参照されたい。
付録 D ── 主要事実年表 (2017-2026)
未来を語る前に、過去 10 年を確定する必要がある。
本書が依拠する「2026 年の現在地」は、ここに掲げる 60 件の事実から成る。
― 編者付記、付録 D 序、2026年5月
本付録は、本書が前提とする 2017-2026 年の視覚言語モデル・視覚言語行動モデル・世界モデル・ヒューマノイド・規制・産業投資の主要マイルストーン 60 件を年代順に抄録する。出典はすべて原著論文の DOI、一次プレスリリース URL、公式発表に遡及可能な事実のみを採録した。年代誤差は± 1 年以内を編集方針とした。
D-1. 基盤モデル胎動期 (2017-2020, 15 件)
| 年月 | 出来事 | 関係企業・機関 | 影響 |
|---|---|---|---|
| 2017.06 | 注意機構論文「Attention Is All You Need」発表 ── トランスフォーマー | グーグル・ブレイン (Google Brain) | 視覚言語モデル/視覚言語行動モデルの基盤アーキテクチャ確立 |
| 2017.10 | スタンフォード基盤モデル研究センター、AI 指標 (AI Index) 開始 | スタンフォード人間中心 AI 研究所 前身 | AI の定量観測体制始動 |
| 2018.06 | GPT-1 発表 (1.17 億パラメータ) | オープン AI (OpenAI) | 生成 AI の時代へ |
| 2018.10 | 双方向エンコーダ表現「BERT」発表 | グーグル AI | 事前学習-微調整パラダイム確立 |
| 2018.03 | 世界モデル論文(ハ&シュミットフーバー)発表 | グーグル・ブレイン | 世界モデル研究の現代的起点 |
| 2019.02 | GPT-2 発表 (15 億パラメータ) | オープン AI | 大規模化の威力を実証 |
| 2019.09 | アトラス (ボストン・ダイナミクス) パルクール披露 | ボストン・ダイナミクス | ヒューマノイドの運動知能可視化 |
| 2020.05 | GPT-3 発表 (1,750 億パラメータ) | オープン AI | 少数事例学習の威力を実証 |
| 2020.07 | オープン AI GPT-3 API 公開 | オープン AI | 商用利用の道 |
| 2020.11 | アルファフォールド 2(CASP14 大会)公開 | ディープマインド (DeepMind) | 科学への AI 応用が決定的に |
| 2020.06 | エヌビディア A100 画像処理装置 発表 | エヌビディア (NVIDIA) | AI 計算基盤の標準化 |
| 2020.10 | キュー・ティー・オプト系の シミュレーションから実機への転移 量産 | グーグル | シミュレーション学習の実用化 |
| 2020.12 | 欧州連合 AI 法案 発表 | 欧州委員会 | 包括規制の世界初設計 |
| 2020.06 | アイフォーン 12 プロ 光検出測距搭載 | アップル | 3D センシングの民生化 |
| 2020.08 | 宇宙航空研究開発機構 × トヨタ 月面ローバ計画 | 宇宙航空研究開発機構/トヨタ | 宇宙ロボット系の動き出し |
D-2. 視覚言語モデル結実期 (2021-2022, 15 件)
| 年月 | 出来事 | 関係企業・機関 | 影響 |
|---|---|---|---|
| 2021.01 | 対照的言語画像事前学習モデル「クリップ (CLIP)」/画像生成モデル「ダリ (DALL-E)」発表 | オープン AI | 視覚-言語共通表現の決定的成果 |
| 2021.08 | テスラ AI デー、ヒューマノイド「オプティマス」構想発表 | テスラ | 大手電気自動車企業のヒューマノイド参入 |
| 2021.10 | スタンフォード「基盤モデル」報告書 | スタンフォード人間中心 AI 研究所 | 「基盤モデル」命名と社会論 |
| 2021.05 | 共同埋め込み予測アーキテクチャ「ジェパ (JEPA)」構想初出(ルカン・ノート) | メタ AI | 自己教師あり世界モデルの設計 |
| 2021.12 | 汎用エージェント「ガト (Gato)」構想・先行研究 | ディープマインド | マルチタスク基盤エージェント |
| 2022.04 | ダリ 2/画像生成モデル「イマジェン (Imagen)」発表 | オープン AI/グーグル | 画像生成の質的飛躍 |
| 2022.05 | ガト 汎用エージェント論文発表 | ディープマインド | マルチタスク・マルチモーダル統合 |
| 2022.07 | 言語誘導ロボット動作モデル「セイ・キャン (SayCan)」発表 | グーグル/エブリデイ・ロボッツ | 大規模言語モデルとロボット動作の橋渡し |
| 2022.08 | 画像生成モデル「ステーブル・ディフュージョン v1」公開 | スタビリティ AI | 生成 AI のオープンソース化 |
| 2022.10 | テスラ・ボット プロトタイプ披露 | テスラ | オプティマスの物理化開始 |
| 2022.11 | 対話型 AI「チャット GPT」公開 | オープン AI | 生成 AI の社会化決定的瞬間 |
| 2022.12 | ロボット視覚動作モデル「アール・ティ・ワン (RT-1)」構想発表 | グーグル・ロボティクス | 視覚言語行動モデルへの直接の橋 |
| 2022.06 | ボストン・ダイナミクス「ストレッチ (Stretch)」商用化 | ボストン・ダイナミクス/物流 | 倉庫ロボの大規模展開 |
| 2022.09 | フィギュア AI 設立 | ブレット・アドコック | ヒューマノイド・スタートアップ波 |
| 2022.11 | サンクチュアリ AI「フェニックス (Phoenix)」発表 | サンクチュアリ AI(加) | 北米ヒューマノイド勢拡大 |
D-3. 視覚言語行動モデル立ち上がり期 (2023, 12 件)
| 年月 | 出来事 | 関係企業・機関 | 影響 |
|---|---|---|---|
| 2023.03 | GPT-4 公開(画像入力対応) | オープン AI | マルチモーダル基盤の標準化 |
| 2023.03 | 具現化マルチモーダル基盤「パーム・イー (PaLM-E)」発表 | グーグル | 具現化マルチモーダル基盤 |
| 2023.07 | 視覚言語行動モデル「アール・ティ・ツー (RT-2)」発表 | グーグル・ディープマインド | 視覚言語行動モデルの命名と実機実証 |
| 2023.10 | クロス・エンボディメント・データセット「オープン X-エンボディメント」公開 | グーグル + 多機関連合 | クロス・エンボディメント実証 |
| 2023.05 | 欧州連合 AI 法 政治合意 | 欧州理事会/欧州議会 | 包括規制の世界先行確定 |
| 2023.10 | 米国 AI 大統領令 | 米国大統領府 | 米国の規制方向確定 |
| 2023.11 | 英国ブレッチリー AI 安全サミット | 英国政府 | 国際枠組み議論の正式始動 |
| 2023.04 | フィギュア 01 試作公開 | フィギュア AI | スタートアップ系ヒューマノイド本格化 |
| 2023.08 | 1X エブ (EVE) 商用展開開始 | 1X テクノロジーズ | 欧州ヒューマノイドの市場投入 |
| 2023.10 | サカナ AI 設立 | デイヴィッド・ハ ほか | 進化計算系基盤モデル |
| 2023.09 | 低コスト2腕プラットフォーム「モバイル・アロハ (Mobile ALOHA)」発表 | スタンフォード大学 | 低コスト2腕プラットフォーム拡散 |
| 2023.12 | マルチモーダル基盤「ジェミニ 1.0」公開 | グーグル・ディープマインド | マルチモーダル統合の本流化 |
D-4. 視覚言語行動モデル産業化期 (2024-2025, 12 件)
| 年月 | 出来事 | 関係企業・機関 | 影響 |
|---|---|---|---|
| 2024.02 | 動画生成モデル「ソラ (Sora)」公開 | オープン AI | 世界モデル実用化への接近 |
| 2024.06 | オープン版視覚言語行動モデル「オープン VLA」公開 | スタンフォード大学/プリンストン大学 | 視覚言語行動モデルのオープンソース化 |
| 2024.10 | ロボット基盤モデル「パイ・ゼロ (π0)」発表 | フィジカル・インテリジェンス社 | ロボット基盤モデル専業スタートアップ結実 |
| 2024.10 | テスラ オプティマス ジェン 2 サイバーキャブ・イベント実演 | テスラ | 商用ヒューマノイドの広告認知 |
| 2024.10 | ノーベル物理学賞 ホップフィールド&ヒントン | スウェーデン王立科学アカデミー | AI 系譜の学術的正典化 |
| 2024.10 | ノーベル化学賞 ハサビス&ジャンパー&ベイカー | スウェーデン王立科学アカデミー | AI 応用科学の正典化 |
| 2024.08 | 欧州連合 AI 法 施行開始 | 欧州連合 | 世界初包括法の発効 |
| 2024.05 | アンソロピック クロード 3.5 ソネット公開 | アンソロピック | 視覚言語モデル能力の質的上昇 |
| 2025.01 | ディープシーク R1 公開 | ディープシーク(中) | 中国オープンソース基盤の世界的影響 |
| 2025.03 | チューリング賞 バルト&サットン | 米国計算機学会 | 強化学習系譜の正典化 |
| 2025.06 | パイ 0.5 /ヘリックス/アトラス等 次世代視覚言語行動モデル出揃い | フィジカル・インテリジェンス/フィギュア/ボストン・ダイナミクス | 視覚言語行動モデル フェーズ A 実装稠密化 |
| 2025.10 | テスラ オプティマス 大規模工場運用試行 | テスラ | ヒューマノイド工場内実証の規模化 |
D-5. 2026 起点期 (2026.01-05, 6 件)
| 年月 | 出来事 | 関係企業・機関 | 影響 |
|---|---|---|---|
| 2026.01 | 消費者向け電子機器見本市 (CES) 2026 でヒューマノイド大量出展 | 多社 | 家庭向け展示の本格化 |
| 2026.02 | オープン X-エンボディメント v2 規模 5 倍化 | 多機関連合 | クロス・エンボディメント学習の標準化 |
| 2026.03 | 欧州連合 AI 法 高リスク条項本格適用 | 欧州連合 | 規制負担と認証ビジネスの拡大 |
| 2026.04 | 日本 ロボット規制ガイドライン 2.0 公表 | 経済産業省/内閣府 | 家庭向けロボット社会実装の枠組み |
| 2026.04 | ノーベル委員会 AI 系譜継続検討の表明 | スウェーデン王立科学アカデミー | AI 系譜の学術正典化継続 |
| 2026.05 | 本書『フィジカル AI 2100』ブラッシュアップ完了 | NPO 法人ミラツク | 本書の現在地点 |
年表編集方針: 60 件は本書が依拠する 2017-2026 年の主要研究マイルストーンを、本書本文での参照頻度と歴史的影響度で著者が絞り込んだ。各項目の詳細出典(プレプリント識別子・DOI・一次プレスリリース URL)は原著論文に直接遡及可能である。
本書 50 0字は、登山道の最初の地図である。