AIのしくみと構造 ─ 何がどう動いているのかを知る
大量のテキストデータから「次に来そうな言葉」を予測する仕組みです。
ChatGPT・Claude・Gemini、すべての生成AIサービスの後ろで動いている「頭脳」がLLMです。
①入力(あなたが文章を送る)→ ②分割(文章を細かい単位に分ける)→ ③予測(次に来そうな言葉を確率で計算)→ ④出力(一番それらしい言葉をつなげて返す)
※厳密にはTransformer(トランスフォーマー)というアーキテクチャが使われています。ここでは「予測エンジン」と理解すればOKです。
パターンを学習しているだけ。だから事実を間違える(ハルシネーション)
学習データに含まれない情報は答えられない。検索機能は後付け
「予測」が仕事なので、正確な計算には別の仕組み(Code Interpreter等)が必要
この3つを知っているだけで、AIへの接し方が変わります。
「AIは万能じゃない。だからこそ人間の判断力が必要。」
皆さんが使っているサービスは、3層構造の中の「真ん中」です。
AIの本体。これ単体では一般ユーザーは使えない。
皆さんが日常的に使うのはここ。データの行き先はこの企業。
便利だが、データが一次サービス経由でさらに外に出る可能性がある。
新しいAIサービスに出会ったら、「これはどの層?」と考える習慣をつけましょう。
層が上がるほど便利だが、データの経路が複雑になる。
| サービス名 | 提供元 | 層 | 得意なこと | 注意点 |
|---|---|---|---|---|
| ChatGPT | OpenAI | 一次 | テキスト生成・画像生成・コード・検索 | 無料版は学習利用あり |
| Claude | Anthropic | 一次 | 長文の理解・分析・丁寧な文章 | 画像生成は非対応 |
| Gemini | 一次 | Google連携・マルチモーダル | 学習OFFで履歴も消える | |
| Copilot | Microsoft | 一次 | Office連携・ビジネス用途 | 法人プランが中心 |
| Gamma | Gamma Tech | 二次 | テキスト→スライド自動生成 | 🟡 公開情報での利用推奨 |
| Napkin AI | Napkin AI Inc. | 二次 | テキスト→図解・ダイアグラム | 🟡 SOC 2 Type II取得済み |
| Perplexity | Perplexity AI | 二次 | AI検索・出典付き回答 | 🟡 無料版は機能制限あり |
= 完成品をそのまま使うイメージ
データは提供側のサーバーに送信される
= エンジンだけ借りるイメージ
データは同じく提供側のサーバーに送信される
最新のLLMは「テキスト」だけでなく、画像・音声・動画も扱えるようになっています。これをマルチモーダルと呼びます。
ChatGPTで画像を生成したり、写真をアップロードして内容を聞いたりできるのは、この機能のおかげです。
※画像生成は内部で別のモデル(DALL-E等)を呼び出している場合もあります。