技術の地図 ─ AIのしくみと構造

LLM（大規模言語モデル）とは

ひとことで言うと

大量のテキストデータから「次に来そうな言葉」を予測する仕組みです。

ChatGPT・Claude・Gemini、すべての生成AIサービスの後ろで動いている「頭脳」がLLMです。

処理の流れ（ざっくり）

①入力（あなたが文章を送る）→ ②分割（文章を細かい単位に分ける）→ ③予測（次に来そうな言葉を確率で計算）→ ④出力（一番それらしい言葉をつなげて返す）

※厳密にはTransformer（トランスフォーマー）というアーキテクチャが使われています。ここでは「予測エンジン」と理解すればOKです。

LLMの3つの特性 ─ できないことを知る

🎭

「理解」していない

パターンを学習しているだけ。だから事実を間違える（ハルシネーション）

📅

計算が苦手

「予測」が仕事なので、正確な計算には別の仕組み（Code Interpreter等）が必要

この3つを知っているだけで、AIへの接し方が変わります。
「AIは万能じゃない。だからこそ人間の判断力が必要。」

AIの世界の構造 ─ 3つの層

皆さんが使っているサービスは、3層構造の中の「真ん中」です。

第1層：LLM（大規模言語モデル）＝頭脳 ─ AI Engines

AIの本体。これ単体では一般ユーザーは使えない。

GPT-4o（OpenAI） Claude（Anthropic） Gemini（Google） Llama（Meta） Command R（Cohere）

▼ LLMの上にサービスが乗っている

第2層：一次サービス＝ LLMを自社で持つ企業のサービス ─ First-Party

皆さんが日常的に使うのはここ。データの行き先はこの企業。

ChatGPT Claude.ai Gemini Copilot（Microsoft）

▼ 一次サービスのLLMを借りて作られたサービス

第3層：二次サービス＝特定用途に特化 ─ Third-Party

便利だが、データが一次サービス経由でさらに外に出る可能性がある。

Gamma（スライド） Napkin AI（図解）イルシル（スライド） Perplexity（検索） Dify（ワークフロー）

新しいAIサービスに出会ったら、「これはどの層？」と考える習慣をつけましょう。
層が上がるほど便利だが、データの経路が複雑になる。

主なサービス一覧

サービス名	提供元	層	得意なこと	注意点
ChatGPT	OpenAI	一次	テキスト生成・画像生成・コード・検索	無料版は学習利用あり
Claude	Anthropic	一次	長文の理解・分析・丁寧な文章	画像生成は非対応
Gemini	Google	一次	Google連携・マルチモーダル	学習OFFで履歴も消える
Copilot	Microsoft	一次	Office連携・ビジネス用途	法人プランが中心
Gamma	Gamma Tech	二次	テキスト→スライド自動生成	🟡 公開情報での利用推奨
Napkin AI	Napkin AI Inc.	二次	テキスト→図解・ダイアグラム	🟡 SOC 2 Type II取得済み
Perplexity	Perplexity AI	二次	AI検索・出典付き回答	🟡 無料版は機能制限あり

WebアプリとAPI ─ 使い方が違うだけ

Webアプリ利用

ChatGPTの画面を開いて使う

＝完成品をそのまま使うイメージ

データは提供側のサーバーに送信される

API利用

自分のアプリからAIエンジンを呼び出す

＝エンジンだけ借りるイメージ

データは同じく提供側のサーバーに送信される

⚠ よくある誤解
「APIならデータが外に出ない」→ これは間違い。
どちらもAIエンジン本体は相手側のサーバーにあるため、入力データは必ずそこに送られます。
違いは「学習に使われるか」の設定と契約内容。→ Step B「危険を知る」で詳しくやります。

補足：マルチモーダルとは

最新のLLMは「テキスト」だけでなく、画像・音声・動画も扱えるようになっています。これをマルチモーダルと呼びます。

ChatGPTで画像を生成したり、写真をアップロードして内容を聞いたりできるのは、この機能のおかげです。

※画像生成は内部で別のモデル（DALL-E等）を呼び出している場合もあります。

技術の地図