2025年7月1日 小山 尚彦 COLUMN

慶大教授、小山尚彦が導くAIの世界 その4、AI エージェント

産業革命を起こす勢いで進化中のAI。慶応義塾大学WPI Bio2Q特任教授の小山尚彦(こやまたかひこ)が、いまさら聞けないAIの基礎知識から最新のコンピューティング情報まで、分かりやすく解説。

小山尚彦(こやま たかひこ)慶応義塾大学WPI Bio2Q特任教授。1999年コーネル大学において物理学博士号を取得。武田薬品工業、IBMワトソン研究所を経て現職。専門はAIとQuantum Computingのライフサイエンスへの応用。武田薬品工業ではがんや中枢薬の研究、リード最適化などを行った。2014年にIBMワトソン研究所でワトソンゲノム解析のリーダーとなる。20年に発表した新型コロナウイルスの論文が中国科学院より先に発表され話題となる。大阪府出身。


アンドリュー・ンによる「エージェント革命」の提唱

AIエージェントが注目されるきっかけとなったのは、AI界の権威であるアンドリュー・ン氏が2024年に発表した重要な提言でした。彼は「AIの次の大きな進歩は、より強力なAIモデルを作ることよりも、エージェント的な働き方をさせることで生まれる」と主張しました。

アンドリュー・ンが提唱した4つの設計パターン

1. Reflection(自己反省): AIが自分の作業を見直して改善する能力
作成した文書を読み直して誤りを修正
コードの品質をチェックして最適化

2. Tool Use(ツール使用): 外部のアプリやサービスを使う能力
Web検索で最新情報を取得
メールやSlackでメッセージ送信
データベースから情報を検索

3. Planning(計画策定): 複雑な作業を段階的に分けて実行する能力
プロジェクトのタスクを整理
優先順位を決めて順番に実行

4. Multi-agent collaboration(複数エージェント協働): 複数のAIが役割分担して協働する能力
デザイナーAI、エンジニアAI、マネージャーAIが連携
それぞれの専門性を活かした作業分担


驚異的な性能向上の実証: プログラミングテストで、HumanEvalコーディングベンチマークにおいて、従来のゼロショットプロンプト手法では、GPT-3.5が48.1%、GPT-4が67.0%の正答率でしたが、GPT-3.5にエージェント的ワークフロー(Agentic Workflow)を適用することで95.1%の正答率を達成し、これは従来手法でのGPT-4の性能を大きく上回りました。
今回はエージェントの中でも、ツールや外部データとの連携の重要性について解説します。

なぜAIはツールや外部データと繋がる必要があるのか?

AIが単体で作業する場合の限界を、具体例で見てみましょう。

数学計算での問題例: 「123456789012345678901234567は素数ですか?」とAIに質問した場合:ChatGPT O3の場合、73859×1671519909724551901613 と回答しますが、4Oの場合、ハルシネーションを起こして間違えてしまいました。いずれにしても、専門性を持つ外部ツールと連携することで、AIはさらに高度な質問に対して正確に返答することができるようになります。

ツールと連携した場合: 素数判定ツール(factordb.com)と連携すれば…
 1. AIが質問を理解
 2. 素数判定ツールに「123456789012345678901234567」を送信
 3. ツールが正確に計算して「素数ではない」と回答
 4. AIが結果を分かりやすく説明
また、このほかリアルタイム性が重要な情報の取得などにも外部データとの連携は威力を発揮します。
 · 天気予報: AIの古い知識「昨日は晴れでした」 → 気象データAPIから「今日の午後は雨が降ります」
 · 株価情報: AIの訓練時点の情報「Apple株は150ドル付近」 → リアルタイム株価API「現在のApple株は203ドル」
 · ニュース: AIの2024年1月までの知識 → 最新ニュースAPIから今日のトップニュース
 · 交通状況: AIの一般的な知識「通常30分の道のり」 → リアルタイム交通情報「現在は渋滞で1時間」
このようにAIエージェントは、AIの理解力・会話能力と専門ツールの正確性・最新性を組み合わせることで、単体では不可能だった高品質なサービスを提供できるようになります。

Web検索エージェントの標準化: 実際、この重要性が認識された結果、最近のLLM(大規模言語モデル)ではWeb検索機能が標準搭載されるようになっています。その背景には、「古い情報での回答」や「ハルシネーション」の問題を解決するためです。ユーザーが「今日のニュース」や「最新の株価」について質問した時、AIが自動的にWeb検索を行い、最新情報に基づいて回答できるようになりました。もともと、Perplexityだけがこのような機能をもっていましたが、他の大規模言語モデルも追従した結果、その優位性が失われつつあります。AIが古い学習データだけに頼っていたら、「地下鉄は通常〜」や「一般的に渋滞の時は〜」「過去にこんなトレンドがありました」といった役に立たない回答しかできません。しかし、リアルタイム検索機能により、今まさに起きている状況や話題に基づいて「現在、地下鉄5号線で30分遅れています。代替ルートとして〜」「今日のトレンドは〇〇で、主な議論のポイントは〜」といった具体的で実用的な情報を提供できるようになります。災害情報、日常的な交通情報、そして社会の話題やトレンドでこそ、AIエージェントのリアルタイム連携機能の真価が発揮されるのです。
このWeb検索機能は、まさにAIエージェントの考え方の先駆けとも言えます。AIが外部ツール(この場合は検索エンジン)と連携することで、より正確で有用な回答を提供する重要性が実証されたのです。それでは、AIエージェントの規格であるMCP(Model Context Protocol)を紹介します。

MCPとは?AIの「USB-C」のような共通規格

Model Context Protocol(MCP)は、2024年11月にAnthropic社が発表した革新的な技術です。これを一言で表現すると「AIのためのUSB-C」です。

従来の問題: 各AIが異なるツールと連携するには、それぞれ専用の接続方法が必要でした。例えば…
 ・AI × 素数判定ツール = 専用コード A
 ・AI × Gmail = 専用コード B
 ・AI × Slack = 専用コード C
 ・AI × 天気APIツール = 専用コード D
これでは開発が大変で、新しいツールとの連携も困難でした。
MCPの解決策: MCPという共通規格を作ることで、一度の開発でどんなLLMとも連携できるようになります。
 ・AI + MCP = あらゆるツールと連携可能

これにより、AIエージェントは簡単に様々な専門ツールを使えるようになり、正確で信頼できる「実用的なアシスタント」として機能するようになりました。以下にカテゴリ別に代表的なMCPサーバーをまとめてみました。

カテゴリ 代表的な MCP サーバー 用途・特徴
データベース・情報管理系
PostgreSQL / MySQL / SQLite・MongoDB・Redis・Elasticsearch / OpenSearch構造化・ドキュメント DB、キャッシュ/ストリーム、全文・ベクトル検索など
開発・プロジェクト管理系
GitHub / GitLab・Sentry・Jira ・Slack ・Microsoft Teams・Notionリポジトリ操作、CI/CD、エラー監視、チケット・ドキュメント、チャット連携
位置情報・地図/交通・航空サービス系
地図/ルート/公共交通:
・Google Maps・ Mapbox・ HERE Maps / HERE Transit  ・Navitia
航空/フライト:
・ Amadeus・Skyscanner・ FlightAware・aviationstack
地図タイル配信、経路・距離検索、GTFS/GTFS-RT によるバス・鉄道時刻、航空券価格・在庫検索、リアルタイム便追跡や ADS-B ストリーミングまで “移動” 全般をカバー
ローカル/クラウドファイル管理系Filesystem (Server-Filesystem)・Google Drive・Amazon S3ローカル/クラウドストレージの安全な参照、検索、OCR、バケット単位の権限分離など

これらのMCPサーバーを使えば、こんな風に「Google Map上でグランドセントラル駅から5分以内でレーティングが4.5以上のランチスポットで20ドル以下のところを探して」とすると、Google Mapsで調べてくれます(別途、Google MapsのAPI KeyとClaude側にMCPサーバーの設定をする必要があります)。Google Mapsに問い合わせるさい、頻繁にClaudeがGoogle Mapsの利用許可を求めてきます。

レストラン名レーティング住所・アクセス価格帯料理ジャンル営業時間(ランチ)おすすめポイント
Omusubi Gonbei⭐4.7370 Lexington Ave(徒歩3分)$3-5日本料理(おにぎり)月-金 8:00-21:00<br>土日 10:00-20:00新鮮なおにぎりが豊富。コスパ最高!
Veselka Grand Central⭐4.7グランドセントラル駅内ダイニングコンコース(駅直結)$10-20ウクライナ料理毎日 8:00-23:00駅直結で便利。ピエロギが名物
Sakagura
⭐4.5211 E 43rd St B1
(徒歩3分)
$15-25日本料理・居酒屋月-金 11:30-14:00
土 休業・日 休業
地下の隠れ家的日本料理店。本格的な味
WOKUNI⭐4.5327 Lexington Ave(徒歩5分)$15-20日本料理・寿司毎日 11:30-14:45モダンな日本料理。質の高い寿司
The Reading Room⭐4.516 E 46th St
(徒歩4分)
$15-20アメリカ料理月-金 12:00-15:00
土日 8:00-15:00
居心地の良い雰囲気。ブランチも人気

現在の課題と将来の展望

住所・アクセス 価格帯 料理ジャンル  営業時間(ランチ)   おすすめポイント

技術的な課題
信頼性の問題:
現在のAIシステムでは、推論が複雑になるほど間違いが増える傾向があります。最新のAIでも3割程度で不正確な情報を提供することがあります。

AIエージェントの安全性への懸念
AIエージェントの高度な能力は、悪用された場合に深刻な社会的リスクを生み出す可能性があります。
サイバー犯罪の自動化では、AIエージェントが大量のフィッシングメールを生成・送信し、個人情報や金融情報を窃取する攻撃を実行する恐れがあります。また、偽のWebサイトを自動生成して詐欺行為を行ったり、マルウェアを拡散させるための巧妙な仕組みを構築したりする可能性もあります。

情報操作と選挙干渉において、AIエージェントはSNSで大量の偽アカウントを操作し、特定の政治的立場を支持する投稿を拡散して世論を操作することができます。選挙期間中には候補者に関する虚偽情報を組織的に流布し、民主的プロセスを阻害する選挙妨害活動を行う危険性があります。

経済的な悪用では、株式市場で偽情報を拡散して株価を操作したり、仮想通貨市場で人工的な価格変動を引き起こしたりする市場操作が懸念されます。また、大量の自動取引を実行して市場の公正性を損なう可能性もあります。

プライバシー侵害として、AIエージェントが個人のデジタル足跡を分析し、本人の同意なしに詳細なプロファイルを作成することが考えられます。さらに、収集した個人情報を悪意のある第三者に販売したり、ストーカー行為や嫌がらせに利用したりするリスクもあります。

社会インフラへの攻撃では、電力網、交通システム、医療機器などの重要インフラにアクセスして、意図的に障害を引き起こし、社会機能を麻痺させる可能性があります。これらの攻撃は人命に直接関わる深刻な結果をもたらす恐れがあります。

次回予告:
第5回では、ヒューマノイドロボットなどのPhysical AIについて解説します。お楽しみに。また、今月末から来月初旬にかけて、北京大学にて医療分野におけるAIの講義をします。今や北京はシリコンバレーと並んで、世界のAIの中心地になりつつあります。この様子などもできれば報告したいと考えています。

RELATED POST