Step A ─ 地図を持つ

技術の地図

AIのしくみと構造 ─ 何がどう動いているのかを知る

LLM(大規模言語モデル)とは

ひとことで言うと

大量のテキストデータから「次に来そうな言葉」を予測する仕組みです。

ChatGPT・Claude・Gemini、すべての生成AIサービスの後ろで動いている「頭脳」がLLMです。

処理の流れ(ざっくり)

①入力(あなたが文章を送る)→ ②分割(文章を細かい単位に分ける)→ ③予測(次に来そうな言葉を確率で計算)→ ④出力(一番それらしい言葉をつなげて返す)

※厳密にはTransformer(トランスフォーマー)というアーキテクチャが使われています。ここでは「予測エンジン」と理解すればOKです。

LLMの3つの特性 ─ できないことを知る

🎭

「理解」していない

パターンを学習しているだけ。だから事実を間違える(ハルシネーション

📅

最新情報は知らない

学習データに含まれない情報は答えられない。検索機能は後付け

🔢

計算が苦手

「予測」が仕事なので、正確な計算には別の仕組み(Code Interpreter等)が必要

この3つを知っているだけで、AIへの接し方が変わります。
「AIは万能じゃない。だからこそ人間の判断力が必要。」

AIの世界の構造 ─ 3つの層

皆さんが使っているサービスは、3層構造の中の「真ん中」です。

第1層:LLM(大規模言語モデル)= 頭脳 ─ AI Engines

AIの本体。これ単体では一般ユーザーは使えない。

GPT-4o(OpenAI) Claude(Anthropic) Gemini(Google) Llama(Meta) Command R(Cohere)
▼ LLMの上にサービスが乗っている

第2層:一次サービス = LLMを自社で持つ企業のサービス ─ First-Party

皆さんが日常的に使うのはここ。データの行き先はこの企業。

ChatGPT Claude.ai Gemini Copilot(Microsoft)
▼ 一次サービスのLLMを借りて作られたサービス

第3層:二次サービス = 特定用途に特化 ─ Third-Party

便利だが、データが一次サービス経由でさらに外に出る可能性がある。

Gamma(スライド) Napkin AI(図解) イルシル(スライド) Perplexity(検索) Dify(ワークフロー)

新しいAIサービスに出会ったら、「これはどの層?」と考える習慣をつけましょう。
層が上がるほど便利だが、データの経路が複雑になる。

主なサービス一覧

サービス名提供元得意なこと注意点
ChatGPTOpenAI一次テキスト生成・画像生成・コード・検索無料版は学習利用あり
ClaudeAnthropic一次長文の理解・分析・丁寧な文章画像生成は非対応
GeminiGoogle一次Google連携・マルチモーダル学習OFFで履歴も消える
CopilotMicrosoft一次Office連携・ビジネス用途法人プランが中心
GammaGamma Tech二次テキスト→スライド自動生成🟡 公開情報での利用推奨
Napkin AINapkin AI Inc.二次テキスト→図解・ダイアグラム🟡 SOC 2 Type II取得済み
PerplexityPerplexity AI二次AI検索・出典付き回答🟡 無料版は機能制限あり

WebアプリとAPI ─ 使い方が違うだけ

Webアプリ利用

ChatGPTの画面を開いて使う

= 完成品をそのまま使うイメージ

データは提供側のサーバーに送信される

API利用

自分のアプリからAIエンジンを呼び出す

= エンジンだけ借りるイメージ

データは同じく提供側のサーバーに送信される

⚠ よくある誤解
「APIならデータが外に出ない」→ これは間違い。
どちらもAIエンジン本体は相手側のサーバーにあるため、入力データは必ずそこに送られます。
違いは「学習に使われるか」の設定と契約内容。→ Step B「危険を知る」で詳しくやります。

補足:マルチモーダルとは

最新のLLMは「テキスト」だけでなく、画像・音声・動画も扱えるようになっています。これをマルチモーダルと呼びます。

ChatGPTで画像を生成したり、写真をアップロードして内容を聞いたりできるのは、この機能のおかげです。

※画像生成は内部で別のモデル(DALL-E等)を呼び出している場合もあります。