Step A ─ 地図を持つ

技術の地図

生成AIの世界はどうなっているか ─ 誰が作り、何があり、どう使い分けるのか

1生成AIの世界は「3つの層」でできている

生成AIの世界地図を理解するために、まず「全体の構造」を押さえましょう。サービスの名前をひとつひとつ覚える必要はありません。大事なのは、それぞれがどの「層」にいるかを知ることです。

第3層:二次サービス・エコシステム
他社のLLMをAPI経由やオープンソースで組み込んだサービス群
例:Perplexity、Notion AI、Canva AI、業界特化型AI
第2層:一次サービス(自社LLMを直接提供するWebサービス)
LLM開発元が自分で運営するチャットサービスやAPI
例:ChatGPT、Gemini、Claude、Grok、DeepSeek Chat
第1層:基盤モデル(Foundation Models)
LLM(大規模言語モデル)そのものを開発・トレーニングしている企業とモデル
例:OpenAI の GPT-5、Google の Gemini、Anthropic の Claude、Meta の Llama 4

▲ 下の層が上の層を支えている ─ ピラミッドの土台が「基盤モデル」

どのサービスがどの層にいるかを知ると、データの流れ先使い分けが見えるようになる

250万+
Hugging Faceに
公開されているAIモデル数
2026年2月時点
※ Hugging Face=世界最大のAIモデル共有プラットフォーム。開発者がAIモデルを公開・共有する「AIのGitHub」的存在
8億
ChatGPTの
週間アクティブユーザー
2025年末時点
9.9億
世界で定期的にAI
チャットボットを利用する人
Microsoft調査

2基盤モデル ─ 誰がAIを作っているか

生成AIの「頭脳」にあたるLLMを開発しているのは、ごく少数の巨大企業とスタートアップです。国・地域によって特徴が大きく異なります。

米国勢 ─ 圧倒的な投資と先行優位

企業代表モデル特徴
OpenAIGPT-5 / GPT-4o生成AIブームの火付け役。最も汎用的で機能が充実。Geminiの急追を受けるも最大シェア維持。Microsoftから130億ドル超の出資
AnthropicClaude Opus 4.6 / Sonnet 4.5AI安全性を最重視。長文処理と論理的推論に強み。エンタープライズ市場シェア32%で首位
GoogleGemini 3.1 Pro / 2.5Transformerの発明元。100万トークンの超大コンテキスト。Google各サービスとの深い統合
MetaLlama 4オープンウェイトLLMの最大推進者。商用利用可能で世界中の企業がカスタマイズに利用
xAIGrok 4 / 3Elon Musk設立。X(旧Twitter)のリアルタイムデータにアクセスできる唯一のAI

欧州勢 ─ EUの技術主権を担う

企業代表モデル特徴
Mistral AI(仏)Mistral Large 3欧州最大のAIスタートアップ。効率性とオープンソースへのコミットメント。GDPR準拠のAI基盤構築を可能に

中国勢 ─ 低コスト・高性能で急追

企業代表モデル特徴
DeepSeekDeepSeek-V3 / R12025年に業界を震撼。訓練コスト約600万ドル(GPT-4の約17分の1)で最先端クラスの性能。データが中国サーバーに送信される可能性あり
AlibabaQwen 3 シリーズ多言語対応に優れ、コーディング・数学・推論で高ベンチマーク。Apache 2.0ライセンスで公開
ByteDanceDoubao(豆包)TikTok親会社。中国国内でシェア急拡大

※ 中国製AIサービスについては、データの送信先やプライバシーに特に注意が必要です(Step Bで詳しく扱います)。

生成AIエコシステムマップ(インタラクティブ)
マウスを乗せると接続関係が表示されます
OpenAI
GPT-5 / GPT-4o
Google
Gemini 3.1 / 2.5
Anthropic
Claude Opus 4.6 / Sonnet 4.5
xAI
Grok 4 / 3
Meta
Llama 4(オープンウェイト)
DeepSeek
V3 / R1(中国)

エコシステムを探索

左の基盤モデル
右のサービス
マウスを乗せてください

ChatGPT
一次(自社LLM)
Gemini
一次(自社LLM)
NotebookLM
二次(Google)
Claude
一次(自社LLM)
Grok
一次(自社LLM)
Perplexity
二次(複数LLM)
Notion AI
二次(複数LLM)
Cursor
二次(複数LLM)
Poe
二次(ほぼ全LLM)

3主要AIチャットサービス ─ 何が使えるか

第2層にあたる「自分のLLMを直接提供するサービス」の比較です。皆さんが実際に触るのは主にこの層です。

ChatGPT(OpenAI)

生成AIの代名詞。画像生成(DALL-E統合)、音声対話、ファイル分析、Deep Research機能など最も機能が充実

月間ユーザー28億人で最大シェア。Geminiの急成長もあり競争が激化中。迷ったらまずこれ。

無料プランあり
Plus $20/月

Gemini(Google)

Gmail・Googleドキュメント・カレンダー・Driveとの統合が最大の強み。100万トークンの超大コンテキストで長文書・動画の分析に対応

無料版でも最新モデルが使える寛大さが特徴。

無料プランあり(高機能)
Advanced ¥2,900/月

Claude(Anthropic)

安全性重視の設計。長文処理と論理的推論、文章の質(自然でロボットっぽくない文体)で高評価。コーディング支援にも強い。

規制産業(金融・医療・法務)での利用が多い。

無料プランあり(制限付)
Pro $20/月

Grok(xAI)

X(旧Twitter)のリアルタイム投稿データにアクセスできる唯一のAIチャット。トレンド分析・時事ニュースの把握に強み

「無フィルター」な応答スタイルは好みが分かれる。

Xプレミアム会員は利用可
SuperGrok $30/月

その他の注目サービス

サービス特徴注意点
Perplexity「AI検索エンジン」。回答に必ず出典を明示。リサーチ用途で高評価内部で複数のLLMを使い分けている
DeepSeek Chat圧倒的に低価格で高品質。オープンソースモデルで自社運用も可能データが中国に送信される可能性。業務利用は要注意
Microsoft CopilotWord・Excel・PowerPointに深く統合されたAI。内部でOpenAIのGPTを利用企業導入が急拡大中。365 Copilotは月額$30
Meta AIInstagram・WhatsApp等Meta製品に統合。完全無料日本語対応は発展途上

「最強のAI」は存在しない。用途に応じて2〜3個を使い分けられることが実務スキル。

4二次サービスの世界 ─ AIの「裏側」を知る

第3層にあたる「二次サービス」は、自分でLLMを作っているわけではなく、他社のLLMをAPI経由で利用したり、オープンソースモデルを組み込んで特定の用途に特化したサービスです。

既存サービスへのAI統合 ─ 知らないうちにAIを使っている

サービスAI機能裏で動いているLLM
Notion AI文書作成・要約・翻訳GPT-4 / Claude(複数)
Canva AIデザイン生成・画像生成複数LLM + Stable Diffusion
Adobe FireflyCreative Cloud全体にAI統合独自モデル(著作権クリア)
GitHub Copilotコード自動補完・生成GPT系
NotebookLM資料読解・要約・音声生成Gemini
Slack AIメッセージ要約・検索複数LLM

二次サービスを使うときの注意点

二次サービスにデータを入力すると、そのデータはサービス提供元裏側のLLM提供元の両方に送信される可能性があります。

例:Notion AIにお客様の情報を入力 → Notionのサーバー+OpenAI or Anthropicのサーバーに送信

→ 二次サービスは「便利だけどデータの流れが見えにくい」。業務で使う前に、利用規約の確認が不可欠です。

業界特化型AI(バーティカルAI)

特定の業界の専門知識を持ち、従来は人間の専門家が行っていた作業をAIが代替するサービスも急成長しています。

業界サービス例何ができるか
法務LegalOn / Harvey契約書レビュー、リスクの洗い出し、判例検索
医療Ambience / Ubie診察会話のリアルタイム記録・カルテ自動作成。Ubieは日本発
CS・サポートPKSHA ChatAgent / Intercom Fin問い合わせへの自動応答。社内FAQの自動回答
経理・財務TOKIUM / Vic.ai請求書処理、経費精算、不正検知の自動化
建設Togal.ai / AKARI建築図面からの自動積算、安全管理の最適化

5文章だけじゃない ─ マルチメディア生成AI

生成AIはテキストだけではありません。画像・動画・音声・音楽の生成も急速に進化しています。

画像生成AI

サービス開発元特徴
DALL-E 3OpenAIChatGPTに統合。日本語プロンプト理解力が高い
MidjourneyMidjourney Inc.芸術性の高い画像生成。クリエイター人気No.1
Adobe FireflyAdobeCreative Cloud統合。商用利用の安全性が高い(著作権クリア素材で学習)
Stable DiffusionStability AIオープンソース。自分のPCで実行可能

動画・音声・音楽生成AI

カテゴリサービス例特徴
動画生成Sora 2(OpenAI)/ Veo 2(Google)/ Runway Gen-3テキストや画像から数秒〜数分の動画を生成。物理法則を理解した自然な映像
音声合成ElevenLabs / CoeFont(日本)多言語対応、感情表現、音声クローン。CoeFontは日本語ナレーションに特化
音楽生成Suno / Udioテキストから歌詞・メロディ・編曲まで一貫して楽曲を自動生成

6日本の国産LLM ─ なぜ重要か

海外のLLMを使うと、入力した業務データが海外のサーバーに送られます。とくに金融・医療・行政など機密性の高い分野では、データを国内で完結できる「国産LLM」の重要性が高まっています。

国産LLMの代表格

企業モデル特徴
NTTtsuzumi 2軽量(1GPUで動作可能)かつ高い日本語性能。オンプレミス運用対応で機密情報を安全に扱える。2025年度に1,800件以上の受注実績
NECcotomi日本語処理速度が商用LLMの約2倍。社内業務で実用済み。三井住友海上や神戸市で導入
SoftBankSarashina国内最大級の計算基盤で日本語特化LLMを開発。通信品質予測で90%以上の精度を達成
富士通Takane / Kozuchiエンタープライズ向け。政府のAIプロジェクト「源内」にも採用
Sakana AIEvoLLM-JP 等進化的アルゴリズムで複数のモデルを「交配」して国産モデルを自動生成。三菱UFJ銀行との実案件検証中
CyberAgentCyberAgentLMオープンソースで公開。日本語ベンチマークでトップクラス。商用利用可

政府のAI「源内」プロジェクト

デジタル庁が主導するガバメントAI「源内(げんない)」が2026年5月から約10万人の政府職員を対象に本格展開予定。法制度調査支援や公用文チェックなど行政業務に特化したAIアプリケーション群で、国産LLM(PLaMo、Takaneなど)を積極的に採用しています。

政府がAIの「ヘビーユーザー」となり、国内のAI産業エコシステムを育成するという国家戦略が動き出しています。

7WebアプリとAPI ─ 2つの使い方を知る

AIサービスには「Webアプリとして使う方法」と「APIを使って自分のシステムに組み込む方法」の2通りがあります。どちらもデータはAI提供元のサーバーに送信される点は同じです。

WebアプリとAPIの違い

Webアプリ利用API利用
例えると完成品のAIサービスをそのまま使う自分のアプリからAIのエンジンを呼び出す
代表例ChatGPT、Gemini、Claude のWebサイト自社アプリにAI機能を組み込む
データの送信先AI提供元のサーバー同じくAI提供元のサーバー
画面提供側が用意自分で作る
学習利用プランによるデフォルトOFF
カスタマイズ限定的自由度が高い

よくある誤解:「APIならデータが外に出ない」

これは間違いです。APIを使っても、AIモデル本体は相手側のサーバーにあるため、データは必ず外部に送信されます。APIの利点は「学習に使われない」「カスタマイズできる」という点であり、データが外に出ないわけではありません。

WebアプリでもAPIでも、データはAI提供元のサーバーに送られる。違いは「学習利用」と「カスタマイズ性」

8オープンソースとクローズドソース ─ 何が違うか

AIモデルには「中身が公開されているもの」と「非公開のもの」があります。この違いは、企業がAIを安全に使う上で非常に重要です。

「オープン」の段階

レベル定義
フルオープンモデルの重み+訓練コード+データセットすべて公開Granite(IBM)
オープンウェイトモデルの重みは公開。訓練データは非公開。カスタムライセンスLlama 4(Meta)、Gemma 3(Google)、Qwen 3
クローズドAPIのみ提供。モデルの中身は非公開GPT-5、Claude、Gemini

企業にとってのメリット・デメリット

クローズドモデル
(ChatGPT等を利用)
オープンモデル
(自社サーバーで実行)
導入の手軽さすぐ使えるサーバー構築が必要
最先端の性能最高性能にアクセス可やや遅れる場合がある
データ安全性データが外部に送信されるデータが社外に出ない
カスタマイズ限定的自社業務に最適化可能
コスト月額課金(利用量に比例)初期投資大、運用はコスト減

多くの企業は、日常業務にはクラウドのChatGPT/Geminiを使い、機密性の高いデータはオープンモデルを自社環境で処理する「ハイブリッド運用」を選択しています。

9この地図はすぐに変わる ─ だからこそ「読み方」を覚える

このレポートに書いた情報は、数ヶ月で大きく変わる可能性があります。個別のサービス名を暗記しても意味がありません。大事なのは「地図の読み方」を身につけること。

変わらない「5つの読み方」

読み方なぜ変わらないか
13層構造を理解する(基盤モデル → 一次サービス → 二次サービス)新しいサービスが出ても、必ずこの3層のどこかに位置する
2オープン vs クローズドの軸を理解するデータの安全性を判断するための基本フレーム
3「裏側で何が動いているか」を確認する便利なサービスでも、データがどこに流れるかは常に確認が必要
4用途で選ぶ(1つに依存しない)「最強のAI」は存在しない。状況に応じた使い分けが実務スキル
5継続的に最新動向をチェックするPerplexity等を使って定期的に確認する習慣をつける

サービスの名前は変わる。モデルの性能は上がる。
でも「構造を理解して、リスクを見抜いて、使い分ける」
この力は変わらない。