ChatGPT は「質問すれば答えてくれる」までは便利だけれど、複数の手順を組み立てて実行するところまでは自分でやらないといけない——その「先」にあるのが AIエージェントです。実際、ラッコキーワードの実測(2026 年 5 月時点)でも「AIエージェント とは」は月 1.8 万人以上が検索しており、私自身も現職の業務システムに RAG /エージェント/チャットボットを組み込んで日常運用しています。
結論から言うと、AIエージェントは LLM に「記憶」と「使える道具」をつけ、目的だけ渡せば段取りを自分で組み立てて進める仕組み——通常のチャットボットの「1 問 1 答」との違いはここが核心です。本記事では、3 つの部品(LLM/記憶/道具)、ChatGPT との違い、主要なツールや実装に必要な 5 要素、非エンジニアの方が触れる第一歩まで、業務でエージェントを組み込んでいる現役の生成AIエンジニア視点で整理します。
結論:AIエージェントは「目的だけ伝えると、自分で進めてくれるアシスタント」です
要点を3行で:
- AIエージェント は、ChatGPT のような AI に「記憶」と「使える道具」をくっつけて、目的に向かって自分で複数の手順を組み立てて進める仕組みです。
- 通常のチャットボットが「1問1答」なのに対し、エージェントは「目的を伝えれば、達成までの段取りを自分で考えて動く」のが本質的な違いです。
- 私自身、現職の業務システムに AIエージェントや社内ドキュメント検索を組み込んで運用しています。本記事はその実装現場の感覚を踏まえて整理しました。
業務でどんな型に落ちるかは、別記事 AI 業務効率化 事例(5 領域 × 5 職種のマトリクス)と AI 業務効率化 ツール(目的別の定番ツール俯瞰)でも掘り下げています。本記事と合わせて読むと「概念 → 事例 → ツール」の流れが繋がります。
技術用語に慣れていない方でも、各章のはじめに用語の噛み砕き解説を置いたので、止まらず最後まで読めるはずです。
AIエージェントの「3つの部品」をたとえで理解する
📖 この章で使う用語
- LLM(エルエルエム、大規模言語モデル):ChatGPT や Claude の正体。膨大な文章を学習した「文章を予測する装置」。営業時代でいう、ものすごく本を読んでいる先輩のイメージ。
- メモリ(記憶):直前の会話や過去の経緯を覚えておく仕組み。営業の議事録メモのような役割。
- ツール(道具):エージェントが外の世界とやり取りするための道具。電卓・地図アプリ・メーラーのようなもの。
AIエージェントを構成する部品は、ざっくり3つです。
1. LLM(推論する頭脳)
「次に何をすべきか」を考える頭の役割を担います。具体例として、OpenAI の GPT-4 系、Anthropic の Claude(クロード)Sonnet 系(2026年5月時点で Claude 3.7 / 4 系が現行)、Google の Gemini(ジェミニ) などのモデルが該当します。コード例は執筆時点で動作確認したモデル名を使っていますが、最新版は docs.anthropic.com で事前にご確認ください。
LLM 自体の正体(何ができるか/何ができないか/代表的な 5 系統)は、別記事の LLM とは で日常のたとえを使って整理しています。
Anthropic の技術ブログは、エージェントの定義について「LLM が自律的にツールを使いながらタスクを実行するシステム」と整理しています。 出典: Building Effective Agents|Anthropic Engineering(取得:2026-05-14)
2. メモリ(記憶)
「直前の会話」「過去の経緯」を引き継ぐ仕組みです。営業のヒアリングで「前回お話しした案件、その後どうなりました?」と切り出すと信頼されるのと、同じ役割です。
短期と長期の2種類があります。
- 短期記憶:今のセッション内での会話の流れ
- 長期記憶:データベースに保存された過去の履歴
長期記憶は、別記事で扱う RAG(ラグ) という仕組みと密接に関わります。詳しくは RAG とは で書きました。
3. ツール(使える道具箱)
エージェントが外の世界とやり取りするための道具です。例として:
- Web検索
- ファイルの読み書き
- 社内データベースへの問い合わせ
- メール送信
- カレンダー操作
- プログラムコードの実行
営業職の道具箱に例えると、見積書作成ツール・名刺管理アプリ・地図アプリの集合のようなものです。「LLM が必要に応じて道具を呼ぶ」「結果を見て次の手を考える」というループが、エージェントが複数ステップで動ける理由です。
チャットボット / 普通のAI / AIエージェントの違い
📖 この章で使う用語
- チャットボット:人間と対話することに特化した AI。LINE で動く自動応答botが身近な例。
混同しやすい3つを並べて整理しておきます。
| 種別 | 動き方 | 例 |
|---|---|---|
| LLM単体 | 1問1答、自分が学習した知識だけで返答 | プロンプトに「文章を要約して」と渡す |
| チャットボット | 1問1答だが、対話の文脈を持つ | 一般的な ChatGPT(カスタムなし) |
| AIエージェント | 目的に向かって、複数の道具を使い分けて、複数ステップで完遂 | 「明日の予定に合わせてランチの店を予約して」と頼むと、カレンダー確認→検索→予約APIを呼ぶ |
ざっくり言えば、「自分で次の一手を決めて、複数の道具を使い分けて、最後まで仕事を終わらせる」のがエージェントの定義です。
主要な AIエージェント「枠組み」たち
📖 この章で使う用語
- フレームワーク(枠組み):エージェントを組み立てるための「設計図セット」。家を建てるときのプレハブパーツのような役割。
- SDK(エスディーケー、ソフトウェア開発キット):AI提供会社(OpenAI / Anthropic)から出ている「公式ツールセット」。
- Tool Use(ツール使用機能):LLM が外部の道具を「呼べる」機能。多くのSDKに標準搭載されている。
2026年5月時点でよく使われる選択肢を、用途別に紹介します。
LangChain / LangGraph(ラングチェーン / ランググラフ)
最も広く使われているフレームワーク群です。LangChain はツールを順番につなぐとき、LangGraph はエージェントの「いま何をやっているか」を細かく管理したいときに使います。
私自身、業務では Anthropic / OpenAI の公式SDKを直接叩く実装と、LangChain 系で複雑なツール連鎖を組む実装を、用途で使い分けています。
LlamaIndex(ラマインデックス)
検索しながら回答する仕組み(RAG)に特化したフレームワークです。「社内ドキュメントを参考に答える」用途で頭ひとつ抜けています。
Anthropic SDK の Tool Use / OpenAI Assistants API
各社の純正SDKが提供する「ツール呼び出し機能」です。外部フレームワークに依存せずシンプルに作りたいときに有用で、私もプロダクション環境でよく使います。
CrewAI / AutoGen
複数のエージェントが協力して動くタイプ。「営業担当 / リサーチ担当 / 編集担当の3エージェントで1本の記事を書く」ようなチーム構成に向いています。私は本格採用には至っていませんが、検証段階で触りました。
動く最小サンプル:20行で書ける「天気を聞ける AI」
📖 この章で使う用語
- API(エーピーアイ):別のサービスとやり取りする「窓口」。お店のレジで使う『注文票』のイメージ。プログラムから AI に「これお願い」と渡すための仕組み。
- APIキー:API を使うための「会員カード番号」。提供元のサイトで取得する。
- 関数(かんすう):プログラムの中で「呼べる手続き」のかたまり。料理レシピのステップに近い。
AIエージェントの正体をいちばん速く理解する方法は、最小のサンプルを動かしてみることです。Python(パイソン)で20行ほどのコードを写経してみてください。
# 最小のAIエージェント:天気を教えてくれる道具を1つだけ持つ Claude
import anthropic
client = anthropic.Anthropic()
# Claude が呼ぶことになる「道具」を1つ用意する
def get_weather(city: str) -> str:
# 本物の天気APIを叩く想定。ここでは説明用に固定の文字を返す
return f"{city}: 22度、晴れ"
response = client.messages.create(
model="claude-3-5-sonnet-20241022",
max_tokens=1024,
tools=[{
"name": "get_weather",
"description": "指定された都市の現在の天気を返す",
"input_schema": {
"type": "object",
"properties": {
"city": {"type": "string", "description": "都市名"}
},
"required": ["city"]
}
}],
messages=[{"role": "user", "content": "東京の天気を教えて。"}]
)
print(response.content)
このコードを実行すると、Claude は「get_weather を city=東京 で呼びたい」と返してきます。あなたのプログラム側で実際にその関数を呼び、結果を Claude に戻してあげれば、Claude はその情報をもとに自然な日本語で回答してくれます。
ここで起きていることは、こんな流れです:
- ユーザーが「東京の天気を教えて」と聞く
- Claude が「
get_weatherを呼ぼう」と判断する - プログラム側で関数を実行する
- 結果を Claude に渡す
- Claude が「東京は22度で晴れですよ」と自然文で答える
これだけです。「道具を増やす」「呼ぶ順番を判断させる」「失敗したらやり直させる」と段階的に複雑にしていくと、いわゆる「AIエージェント」になります。
実装で必要になる「5つの要素」
📖 この章で使う用語
- プロンプト:LLM に渡す「指示文」。**営業時代の『話す前の台本』**にとても近い。
- システムプロンプト:エージェントの「役割定義」を最初に置く指示文。「あなたは営業アシスタントです」のように設定する。
- ハルシネーション:AI が「自信満々に間違える」現象。新人時代の自分が、知らない案件を聞かれて適当に答えてしまうあの感じ。
- 評価設計:「動いてるか/間違ってるか」を判定する仕組み。
業務で組むときに私が気をつけている点を、5つに整理しました。
1. 明確な目的とゴール
「何ができたら成功か」を最初に言語化します。これがブレると、エージェントは延々と動き続けます。私は業務エージェントを設計するとき、最初に「成功の定義」と「失敗の定義」を1行ずつ書くようにしています。
2. 道具(ツール)の数を絞る
エージェントに与える道具を厳選します。多すぎると「どれを使うべきか」を毎回 LLM が判断する負担が増え、誤りも増えます。最初は2-3個の道具で始めるのが安全です。
3. プロンプト設計
システムプロンプト、道具の説明文、入力フォーマットの3つを丁寧に書きます。一般的に、道具の説明文があいまいだとエージェントが誤動作します。営業時代の「気配り」が一番活きるところで、「使う側の目線で書く」と精度が上がります。
4. 状態(記憶)の管理
セッション内の会話の流れと、過去履歴の両方を設計します。短期は LLM が直接覚えてくれますが、長期はデータベースなど別の保存先が必要になります。
5. 評価設計
「ちゃんと動いているか」を毎回どう判定するか。最初は人手で正解パターンを10件用意して合否を見るのが基本です。LLMに評価させる手法(LLM-as-a-judge)に行くのは、人手の評価が安定してからです。
※評価設計と改善ループは、エージェント実装でもっとも軽視されがちで、もっとも効くポイントだと、業務を通じて実感しています。最初の頃の私自身も、評価設計の重要性に気づくのは後になってからでした。
未経験から AIエージェントを触る最初の一歩
📖 この章で使う用語
- Python(パイソン):プログラミング言語のひとつ。AI関連でもっともよく使われている、比較的入りやすい言語。
- GPTs(ジーピーティーズ):ChatGPT 上で「コードを書かずに」作れる簡易AIアシスタント。
「私はエンジニアではない」「Pythonも触ったことがない」という方向けに、段階的なロードマップを置きます。
- 環境準備:手元の Mac か Windows に Python 3.11 以降を入れる
- APIキー取得:Anthropic または OpenAI のダッシュボードで、無料枠ありのキーを取得
- 最小サンプル写経:本記事のコードをそのまま動かす(30分以内に動くはず)
- 道具を1つ増やす:天気のかわりに「Web検索」を呼ぶ版に改造してみる
- 記憶を持たせる:複数回の会話で前後の文脈を保持できるよう改造する
- LangGraph に触る:複雑な動きを扱えるフレームワークで、実用エージェントに近づける
ここまでで、だいたい週末2回ぶんくらいです。ChatGPT そのものの始め方と、API キーの取得手順までは ChatGPT 始め方 で詳しく書きました。コード実行する前段の API キーまわりは、そちらをご覧ください。
実装に踏み込みたい方は、4 ルート(Python + LangChain / ノーコード / Microsoft Copilot Studio / Claude Projects・GPTs)を業務で実際に使っている範囲で整理した別記事 AIエージェント 作り方 もあわせてどうぞ。本記事が「概念」、別記事が「作り方」、と読み分けてください。
よくある質問
Q1. AIエージェントを動かすのに、いくらかかりますか?
A. 最小サンプルなら、無料枠で十分試せます。Anthropic も OpenAI も新規アカウントには無料クレジットがあり、本記事のサンプルなら1回の実行が数円程度です。本格的なプロダクション運用に乗せると、月数千〜数万円〜の範囲になりますが、最初は気にしなくて大丈夫です。
Q2. 「自律的」とは、どこまで自律的なのですか?
A. 現状(2026年5月時点)の AIエージェントは、人間が「目的」と「使ってよい道具」を渡す範囲で自律です。完全な「自律 AI」ではありません。むしろ、人間がガードレールを丁寧に設計する仕事のほうが本質的に重要です。
Q3. 私はエンジニアではないのですが、エージェントを「使う側」になれますか?
A. 十分なれます。ChatGPT の カスタムGPTs や Claude の Projects 機能は、コードを書かずに簡易的なエージェントを作れる仕組みです。ノーコード派の方は、まずそこから入ると感触がつかめます。ただし「業務で本気で使う」「他人に提供する」段階では、コードを書いたほうが安定するのが現実です。
Q4. 業務で使うときの一番のリスクは何ですか?
A. **「期待していた動作と違うことを、自信満々にやってしまう」**ことです。具体的には:
- 誤った情報をもとに、外部の道具を呼んでしまう
- 機密情報を、想定外の場所に書き込んでしまう
- 「うまくできました」と返してくるが、実際は失敗している
これらは、評価設計(5要素の5つ目)と「人間の最終確認」で抑える必要があります。私の場合、業務エージェントは重要な操作の前に人間の承認を挟む設計を基本にしています。
Q5. ChatGPT のカスタムGPTs もAIエージェントですか?
A. 広義にはYesです。GPTs は OpenAI の Assistants API を簡易UIでラップしたもので、ツール呼び出しや文書参照の機能を持ちます。ただし「自分の業務システムから呼びたい」「フロー全体をコードで管理したい」となると、OpenAI Assistants API か他のフレームワークに移行することになります。
まとめ
- AIエージェントは「目的を伝えると、自分で段取りを組んで進めるアシスタント」のことで、**LLM・メモリ・道具(ツール)**の3要素が核になります。
- 通常のチャットボットとは「複数ステップで自分で考えて動けるかどうか」が決定的に違います。
- 主要な枠組みは LangChain / LangGraph / LlamaIndex / 各社純正SDK。最小サンプルは20行で動きます。
- 業務で組むときは「目的の言語化」「道具の絞り込み」「プロンプト設計」「記憶の管理」「評価設計」の5つが鍵です。
- 未経験からでも、週末2回くらいで「自分で改造して動かせる」ところまではいけます。
私自身、現職で AIエージェントや社内ドキュメント検索の仕組みを業務プロダクトに組み込んでいます。実装の現場感覚で書きました。本記事に対する質問・誤りのご指摘は send@bon-bon-tools.com までお願いします。
関連記事
- AIエージェント MCP——「作る側」スポークの一つ、MCP で手と目を増やす
- Vertex AI とは——Google Cloud の AI 基盤。Gemini と Claude on Vertex の二本柱・料金・3 基盤比較を業務試用視点で整理
- 生成AI 入門——5 ペルソナ別 30 日学習プランで通貫整理
- AIエージェント 作り方——4 ルートを業務で実際に使っている範囲で整理しました
- LangGraph とは——状態を持つエージェントをグラフで組む道具を、LangChain との違いから整理
- Dify 使い方——ノーコード AI エージェント基盤を業務で扱う現役生成AIエンジニアが、4 アプリタイプ・初心者 5 ステップ・RAG 構築まで整理しました
- AWS Bedrock とは何か——直 API との料金比較・Claude Code 連携・AgentCore まで整理
- LLM とは何か——日常のたとえで整理
- RAG とは何か——日常のたとえで整理
- AI コーディングとは何か——3 つのレイヤーで読み解く実務ガイド
- ChatGPT 始め方——10 分で動かせる最短ルート
- Claude 使い方——3 兄弟整理を丸ごと
- Claude Opus とは何か——4.5 / 4.6 / 4.7 とモデル使い分け整理
- Claude Code 使い方——最初の 30 分から解説
- Claude Code 始め方——初回 30 分のステップ
- Cursor 使い方——非エンジニアでも触れる 30 分
- Claude Cowork 使い方——もう一人のあなたを動かす
- Claude 料金プラン——全プランを試した選び方
- AI 業務効率化 事例——5 領域×5 職種で整理しました
- AI 業務効率化 ツール——7 種を目的×職種で整理しました
- AI 議事録 おすすめ——3 系統と用途別使い分けを整理しました
- AI 翻訳 おすすめ——3 ツール用途別整理
- AI 画像生成 無料——UI ベース無料 6 ツール整理
- AI 画像生成 プロンプト——4 要素モデル公開
- AI 動画生成 おすすめ——2 系列と用途別の選び方を整理しました
- エンジニア 転職 未経験——3 段階のキャリアパス整理
- SES やめとけと検索したあなたへ——入口・地雷・出口整理
- AI コードレビューとは何か——プロンプト 5 型・主要 7 ツール・ローカル LLM まで丸ごと整理
- Claude Code Action とは——GitHub Actions に Claude Code を組み込む公式ハーネス
- Claude Opus と Sonnet の違い——3 モデル使い分けと 5 軸比較整理
- Claude Sonnet 4.6 とは——直 API / Bedrock / GitHub 統合の 3 経路と Opus / Codex 系比較を整理
- LLM ローカル——Apple Silicon Mac で Ollama を動かす個人検証視点の整理
- Claude Skills とは何か——SKILL.md / 自作 3 系統 / Slash commands・MCP・Tools との違いを整理
- Azure OpenAI Service とは何か——GPT/Codex モデル一覧・料金・直 API/AWS Bedrock 3 経路使い分け・「Azure に Claude はない」誤解まで整理
- Claude Skills を自作する——SKILL.md の書き方から業務 3 系統・チーム配布まで「作る側」を実演
- Vibe coding とは——感覚で AI に書かせ、人間はレビューと方向づけに回る新スタイルを業務実践視点で整理
- Codex CLI とは——OpenAI 系の Claude Code 相当を、両方触った現役の生成AIエンジニアが比較しながら整理しました
- MCP サーバー 作り方——Python/TypeScript SDK で自作し本番運用まで「作る側」の完全マニュアル
- Gemini CLI 使い方——Google のターミナル型 AI コーディングを 3 ツール比較で整理
- Gemini API 使い方——コードから Gemini を呼ぶ最小サンプルを Python・GAS で
出典
- Building Effective Agents|Anthropic Engineering(取得:2026-05-14)
- Tool use overview|Anthropic API docs(取得:2026-05-14)
- Function calling guide|OpenAI Platform(取得:2026-05-14)