生成AIの世界はどうなっているか ─ 誰が作り、何があり、どう使い分けるのか
生成AIの世界地図を理解するために、まず「全体の構造」を押さえましょう。サービスの名前をひとつひとつ覚える必要はありません。大事なのは、それぞれがどの「層」にいるかを知ることです。
▲ 下の層が上の層を支えている ─ ピラミッドの土台が「基盤モデル」
どのサービスがどの層にいるかを知ると、データの流れ先と使い分けが見えるようになる
生成AIの「頭脳」にあたるLLMを開発しているのは、ごく少数の巨大企業とスタートアップです。国・地域によって特徴が大きく異なります。
| 企業 | 代表モデル | 特徴 |
|---|---|---|
| OpenAI | GPT-5 / GPT-4o | 生成AIブームの火付け役。最も汎用的で機能が充実。Geminiの急追を受けるも最大シェア維持。Microsoftから130億ドル超の出資 |
| Anthropic | Claude Opus 4.6 / Sonnet 4.5 | AI安全性を最重視。長文処理と論理的推論に強み。エンタープライズ市場シェア32%で首位 |
| Gemini 3.1 Pro / 2.5 | Transformerの発明元。100万トークンの超大コンテキスト。Google各サービスとの深い統合 | |
| Meta | Llama 4 | オープンウェイトLLMの最大推進者。商用利用可能で世界中の企業がカスタマイズに利用 |
| xAI | Grok 4 / 3 | Elon Musk設立。X(旧Twitter)のリアルタイムデータにアクセスできる唯一のAI |
| 企業 | 代表モデル | 特徴 |
|---|---|---|
| Mistral AI(仏) | Mistral Large 3 | 欧州最大のAIスタートアップ。効率性とオープンソースへのコミットメント。GDPR準拠のAI基盤構築を可能に |
| 企業 | 代表モデル | 特徴 |
|---|---|---|
| DeepSeek | DeepSeek-V3 / R1 | 2025年に業界を震撼。訓練コスト約600万ドル(GPT-4の約17分の1)で最先端クラスの性能。データが中国サーバーに送信される可能性あり |
| Alibaba | Qwen 3 シリーズ | 多言語対応に優れ、コーディング・数学・推論で高ベンチマーク。Apache 2.0ライセンスで公開 |
| ByteDance | Doubao(豆包) | TikTok親会社。中国国内でシェア急拡大 |
※ 中国製AIサービスについては、データの送信先やプライバシーに特に注意が必要です(Step Bで詳しく扱います)。
左の基盤モデルか
右のサービスに
マウスを乗せてください
第2層にあたる「自分のLLMを直接提供するサービス」の比較です。皆さんが実際に触るのは主にこの層です。
生成AIの代名詞。画像生成(DALL-E統合)、音声対話、ファイル分析、Deep Research機能など最も機能が充実。
月間ユーザー28億人で最大シェア。Geminiの急成長もあり競争が激化中。迷ったらまずこれ。
Gmail・Googleドキュメント・カレンダー・Driveとの統合が最大の強み。100万トークンの超大コンテキストで長文書・動画の分析に対応。
無料版でも最新モデルが使える寛大さが特徴。
安全性重視の設計。長文処理と論理的推論、文章の質(自然でロボットっぽくない文体)で高評価。コーディング支援にも強い。
規制産業(金融・医療・法務)での利用が多い。
X(旧Twitter)のリアルタイム投稿データにアクセスできる唯一のAIチャット。トレンド分析・時事ニュースの把握に強み。
「無フィルター」な応答スタイルは好みが分かれる。
| サービス | 特徴 | 注意点 |
|---|---|---|
| Perplexity | 「AI検索エンジン」。回答に必ず出典を明示。リサーチ用途で高評価 | 内部で複数のLLMを使い分けている |
| DeepSeek Chat | 圧倒的に低価格で高品質。オープンソースモデルで自社運用も可能 | データが中国に送信される可能性。業務利用は要注意 |
| Microsoft Copilot | Word・Excel・PowerPointに深く統合されたAI。内部でOpenAIのGPTを利用 | 企業導入が急拡大中。365 Copilotは月額$30 |
| Meta AI | Instagram・WhatsApp等Meta製品に統合。完全無料 | 日本語対応は発展途上 |
「最強のAI」は存在しない。用途に応じて2〜3個を使い分けられることが実務スキル。
第3層にあたる「二次サービス」は、自分でLLMを作っているわけではなく、他社のLLMをAPI経由で利用したり、オープンソースモデルを組み込んで特定の用途に特化したサービスです。
| サービス | AI機能 | 裏で動いているLLM |
|---|---|---|
| Notion AI | 文書作成・要約・翻訳 | GPT-4 / Claude(複数) |
| Canva AI | デザイン生成・画像生成 | 複数LLM + Stable Diffusion |
| Adobe Firefly | Creative Cloud全体にAI統合 | 独自モデル(著作権クリア) |
| GitHub Copilot | コード自動補完・生成 | GPT系 |
| NotebookLM | 資料読解・要約・音声生成 | Gemini |
| Slack AI | メッセージ要約・検索 | 複数LLM |
二次サービスにデータを入力すると、そのデータはサービス提供元と裏側のLLM提供元の両方に送信される可能性があります。
例:Notion AIにお客様の情報を入力 → Notionのサーバー+OpenAI or Anthropicのサーバーに送信
→ 二次サービスは「便利だけどデータの流れが見えにくい」。業務で使う前に、利用規約の確認が不可欠です。
特定の業界の専門知識を持ち、従来は人間の専門家が行っていた作業をAIが代替するサービスも急成長しています。
| 業界 | サービス例 | 何ができるか |
|---|---|---|
| 法務 | LegalOn / Harvey | 契約書レビュー、リスクの洗い出し、判例検索 |
| 医療 | Ambience / Ubie | 診察会話のリアルタイム記録・カルテ自動作成。Ubieは日本発 |
| CS・サポート | PKSHA ChatAgent / Intercom Fin | 問い合わせへの自動応答。社内FAQの自動回答 |
| 経理・財務 | TOKIUM / Vic.ai | 請求書処理、経費精算、不正検知の自動化 |
| 建設 | Togal.ai / AKARI | 建築図面からの自動積算、安全管理の最適化 |
生成AIはテキストだけではありません。画像・動画・音声・音楽の生成も急速に進化しています。
| サービス | 開発元 | 特徴 |
|---|---|---|
| DALL-E 3 | OpenAI | ChatGPTに統合。日本語プロンプト理解力が高い |
| Midjourney | Midjourney Inc. | 芸術性の高い画像生成。クリエイター人気No.1 |
| Adobe Firefly | Adobe | Creative Cloud統合。商用利用の安全性が高い(著作権クリア素材で学習) |
| Stable Diffusion | Stability AI | オープンソース。自分のPCで実行可能 |
| カテゴリ | サービス例 | 特徴 |
|---|---|---|
| 動画生成 | Sora 2(OpenAI)/ Veo 2(Google)/ Runway Gen-3 | テキストや画像から数秒〜数分の動画を生成。物理法則を理解した自然な映像 |
| 音声合成 | ElevenLabs / CoeFont(日本) | 多言語対応、感情表現、音声クローン。CoeFontは日本語ナレーションに特化 |
| 音楽生成 | Suno / Udio | テキストから歌詞・メロディ・編曲まで一貫して楽曲を自動生成 |
海外のLLMを使うと、入力した業務データが海外のサーバーに送られます。とくに金融・医療・行政など機密性の高い分野では、データを国内で完結できる「国産LLM」の重要性が高まっています。
| 企業 | モデル | 特徴 |
|---|---|---|
| NTT | tsuzumi 2 | 軽量(1GPUで動作可能)かつ高い日本語性能。オンプレミス運用対応で機密情報を安全に扱える。2025年度に1,800件以上の受注実績 |
| NEC | cotomi | 日本語処理速度が商用LLMの約2倍。社内業務で実用済み。三井住友海上や神戸市で導入 |
| SoftBank | Sarashina | 国内最大級の計算基盤で日本語特化LLMを開発。通信品質予測で90%以上の精度を達成 |
| 富士通 | Takane / Kozuchi | エンタープライズ向け。政府のAIプロジェクト「源内」にも採用 |
| Sakana AI | EvoLLM-JP 等 | 進化的アルゴリズムで複数のモデルを「交配」して国産モデルを自動生成。三菱UFJ銀行との実案件検証中 |
| CyberAgent | CyberAgentLM | オープンソースで公開。日本語ベンチマークでトップクラス。商用利用可 |
デジタル庁が主導するガバメントAI「源内(げんない)」が2026年5月から約10万人の政府職員を対象に本格展開予定。法制度調査支援や公用文チェックなど行政業務に特化したAIアプリケーション群で、国産LLM(PLaMo、Takaneなど)を積極的に採用しています。
政府がAIの「ヘビーユーザー」となり、国内のAI産業エコシステムを育成するという国家戦略が動き出しています。
AIサービスには「Webアプリとして使う方法」と「APIを使って自分のシステムに組み込む方法」の2通りがあります。どちらもデータはAI提供元のサーバーに送信される点は同じです。
| Webアプリ利用 | API利用 | |
|---|---|---|
| 例えると | 完成品のAIサービスをそのまま使う | 自分のアプリからAIのエンジンを呼び出す |
| 代表例 | ChatGPT、Gemini、Claude のWebサイト | 自社アプリにAI機能を組み込む |
| データの送信先 | AI提供元のサーバー | 同じくAI提供元のサーバー |
| 画面 | 提供側が用意 | 自分で作る |
| 学習利用 | プランによる | デフォルトOFF |
| カスタマイズ | 限定的 | 自由度が高い |
これは間違いです。APIを使っても、AIモデル本体は相手側のサーバーにあるため、データは必ず外部に送信されます。APIの利点は「学習に使われない」「カスタマイズできる」という点であり、データが外に出ないわけではありません。
WebアプリでもAPIでも、データはAI提供元のサーバーに送られる。違いは「学習利用」と「カスタマイズ性」
AIモデルには「中身が公開されているもの」と「非公開のもの」があります。この違いは、企業がAIを安全に使う上で非常に重要です。
| レベル | 定義 | 例 |
|---|---|---|
| フルオープン | モデルの重み+訓練コード+データセットすべて公開 | Granite(IBM) |
| オープンウェイト | モデルの重みは公開。訓練データは非公開。カスタムライセンス | Llama 4(Meta)、Gemma 3(Google)、Qwen 3 |
| クローズド | APIのみ提供。モデルの中身は非公開 | GPT-5、Claude、Gemini |
| クローズドモデル (ChatGPT等を利用) | オープンモデル (自社サーバーで実行) | |
|---|---|---|
| 導入の手軽さ | すぐ使える | サーバー構築が必要 |
| 最先端の性能 | 最高性能にアクセス可 | やや遅れる場合がある |
| データ安全性 | データが外部に送信される | データが社外に出ない |
| カスタマイズ | 限定的 | 自社業務に最適化可能 |
| コスト | 月額課金(利用量に比例) | 初期投資大、運用はコスト減 |
多くの企業は、日常業務にはクラウドのChatGPT/Geminiを使い、機密性の高いデータはオープンモデルを自社環境で処理する「ハイブリッド運用」を選択しています。
このレポートに書いた情報は、数ヶ月で大きく変わる可能性があります。個別のサービス名を暗記しても意味がありません。大事なのは「地図の読み方」を身につけること。
| 読み方 | なぜ変わらないか | |
|---|---|---|
| 1 | 3層構造を理解する(基盤モデル → 一次サービス → 二次サービス) | 新しいサービスが出ても、必ずこの3層のどこかに位置する |
| 2 | オープン vs クローズドの軸を理解する | データの安全性を判断するための基本フレーム |
| 3 | 「裏側で何が動いているか」を確認する | 便利なサービスでも、データがどこに流れるかは常に確認が必要 |
| 4 | 用途で選ぶ(1つに依存しない) | 「最強のAI」は存在しない。状況に応じた使い分けが実務スキル |
| 5 | 継続的に最新動向をチェックする | Perplexity等を使って定期的に確認する習慣をつける |
サービスの名前は変わる。モデルの性能は上がる。
でも「構造を理解して、リスクを見抜いて、使い分ける」
この力は変わらない。