言語を切り替える
テーマを切り替える

メディアを越える創作:Nano Banana 2 と Gemini 3 でスケッチからスライド完成まで自動化する

水曜日の午後、上司がグループチャットで突然メンションしてきました。「明日午前中に投資家向けデモがある。20 ページのスライドが必要だ。うちの製品の技術アーキテクチャと市場展望を分かりやすくまとめておいてくれ」。

そのメッセージを見て、頭の中に浮かんだのはただ一つの言葉——「終わった……」。

20 ページの高品質なスライドには、構成、内容、画像、レイアウトが必要です。従来のやり方なら、一晩かけてアウトラインを書き、素材を探し、配色を調整し、永遠に揃わないテキストボックスと格闘することになります。

でもその夜、私はいつもとは違うことをしました。

NotebookLM を開き、製品ドキュメントをいくつかアップロードしてこう指示しました。「これらの資料に基づき、投資家向けプレゼンのアウトラインを生成して。技術アーキテクチャと市場展望を重視して」。10 分後、アウトラインが出来上がりました。

次に Gemini 3 を開き、Nano Banana 2 を呼び出しました。「技術アーキテクチャのセクション用に、システム階層図を生成して。青を基調としたテクノロジースタイル、4K 解像度で」。画像が生成されました。

最後に Google Slides API で、すべての内容を自動的に繋ぎ合わせ、完成したプレゼンテーションに仕上げました。タスクを受け取ってから完了するまで、合計 2 時間足らずでした。

その瞬間、確信しました。クリエイティブ・ワークフローは根底から変わりつつあると。もはや「人間がすべてをやる」のではなく、「人間が方向性を定義し、AI がメディアの壁を越えて実行する」時代になったのです。

この記事は、そんな新しいワークフローについて書いたものです。スケッチからスライドへ、文字からビジュアルへ。Nano Banana 2 と Gemini 3 が創作プロセスをどう再構築するかを解説します。

Nano Banana 2:Google 画像生成の新しいスタンダード

まずは、発表されたばかりの Nano Banana 2 について。

2026 年 2 月 26 日、Google は Nano Banana 2 を正式にリリースしました。2025 年後半の初代 Nano Banana、11 月の Pro 版に続く最新アップグレードです。技術的には Gemini 3.1 Flash Image ですが、パフォーマンスの向上は目に見えます。

主な特性は次のとおりです。

速度向上:Pro 版と比べ、高品質を保ちながら生成速度が大幅に向上しました。大量のビジュアル素材を一度に作る場面では、この速さが決定的です。

柔軟な解像度:512px から 4K まで、さまざまなアスペクト比に対応。スライド表紙用の 16:9 横長も、SNS 用の正方形も問題ありません。

キャラクターの一貫性:シリーズコンテンツを作るときの強力な機能です。キャラクターやスタイルを揃えた画像セットを生成でき、製品ストーリーやブランドビジュアルに向いています。

SynthID ウォーターマーク内蔵:Google の AI コンテンツ識別技術で、生成画像に目に見えない透かしを自動付与。識別と追跡が容易になります。

端的に言えば、Nano Banana 2 はおもちゃではなく、プロダクション級のツールです。

文字からビジュアルへ:自然言語が駆動する画像生成

従来の画像制作フローはどうでしょうか。

デザイナーが要件を理解する → 参考を探す → ラフを描く → PC で制作する → 修正する → 完成。一枚の画像に数時間、場合によっては数日かかることも珍しくありません。

Nano Banana 2 が変えるのは、ステップ 1 から 4 の間にある大きな溝です。欲しい画面を自然言語で描写するだけで済みます。

例えば、技術アーキテクチャのページに使う「データの流れ」のコンセプト図が必要だとします。以前ならデザイナーに延々と説明していましたが、今は Gemini 3 にこう入力するだけです。

「エッジデバイスからクラウド処理センターへデータが流れるプロセスを表現した、抽象的な技術アーキテクチャ図を生成して。濃いブルーとエレクトリックブルーのグラデーションを使い、テクノロジーを感じさせるラインとノードを配置して。4K 解像度、16:9。スタイルは現代的な SaaS 製品の公式サイトにある画像を参考にして。」

30 秒後、使える素材が手に入ります。100% 完璧ではないかもしれませんが、初稿やコンセプト検証としては十分です。

プロンプトのコツ

  • スタイルを具体的に:「いい感じに」ではなく「フラットイラスト」や「3D レンダリングの質感」と書く
  • 用途を指定する:「スライド背景用」「アイコン向け」「表紙に適した」など
  • 色彩をコントロール:「ブランドカラー #1E90FF と白を組み合わせて」のように主色を直接指定
  • 参照を示す:「Apple の発表会のようなビジュアル」「Notion 公式サイトのイラストのような質感」

スケッチから完成品へ:視覚 + ロジックの二重自動化

文字からの画像生成は第一歩に過ぎません。より面白いのが「スケッチ駆動」のワークフローです。

こんなシーンを想像してください。ノートにいくつかの四角と線を描き、「ユーザーレイヤー」「API レイヤー」「データレイヤー」とラベルを付けたラフを描いたとします。それをスマホで撮影して Gemini 3 にアップロードし、こう言います。「このアーキテクチャのスケッチに基づき、エンタープライズ SaaS のビジュアルスタイルでプロフェッショナルな製品構成図を生成して。適切なアイコンと装飾も加えて」。

Gemini 3 はスケッチの論理構造を理解し、Nano Banana 2 が指示に沿ったビジュアルを生成します。スケッチの「意図」は保たれ、「表現」だけがアップグレードされます。

この「視覚 + ロジック」の二重自動化の鍵は、Gemini 3 のマルチモーダル能力にあります。単に画像を見るのではなく、図中の論理関係を理解し、テキスト指示と組み合わせて新しいビジュアルを出力するのです。

実際の応用では、次のような場面で特に威力を発揮します。

  • クイック・プロトタイピング:紙とペンで素早くアイデアを描き、AI がプロ品質のビジュアルに変換
  • チーム・コラボレーション:PM がスケッチを描き、デザイナーが AI で仕上げることで効率が倍増
  • 反復的な最適化:生成 → 修正指示 → 再生成。数ラウンドで実用レベルに到達

スライド作成の自動化:NotebookLM + Google Slides

画像が揃ったら、次はそれらを一つのプレゼンテーションにまとめます。

ここで NotebookLM と Google Slides API の 2 ツールが組み合わさります。

NotebookLM の役割は、バラバラのコンテンツ(ドキュメント、PDF、Web ページ)を構造化されたストーリーに整理することです。製品要件定義書、技術白書、市場調査レポートを投げ込み、「投資家向けプレゼンの構成案を作って。各ページに主要ポイントを添えて」と指示します。

NotebookLM は次のことを行います:

  • 重要な情報を抽出する
  • 論理的なページ構造に組み立てる
  • 各ページのタイトルと要点を生成する

次に Google Slides API でスライドを自動作成します。次のようなスクリプトを書けます。

from googleapiclient.discovery import build
from google.oauth2 import service_account

# 認証
service = build('slides', 'v1', credentials=creds)

# プレゼンテーションを作成
presentation = service.presentations().create(
    body={'title': '製品技術アーキテクチャ'}
).execute()
presentation_id = presentation.get('presentationId')

# スライドを一括追加
for slide_content in notebooklm_outline:
    service.presentations().batchUpdate(
        presentationId=presentation_id,
        body={'requests': [{
            'createSlide': {
                'slideLayoutReference': {
                    'predefinedLayout': 'TITLE_AND_BODY'
                }
            }
        }]}
    ).execute()
    # Nano Banana 2 で生成した画像を挿入...

ワークフロー全体はこうなります:

  1. NotebookLM が内容を分析 → アウトラインと文案を生成
  2. Nano Banana 2 が画像を生成 → ビジュアル素材を提供
  3. Google Slides API が自動レイアウト → 完成品を出力

かつてはデザイナー、コピーライター、数時間の作業が必要だったことが、今や一人で数十分で初稿まで仕上がります。

未来のトレンド:クリエイティブ作業のパラダイムシフト

こうしたワークフローは、一体何を意味するのでしょうか。

私は 3 つのレイヤーでの変化があると考えています。

第 1 レイヤー:効率の向上

最も直接的な変化です。数日かかっていた仕事が、数時間、場合によっては数十分で初稿まで終わります。人間が速くなったのではなく、実行を AI に任せ、判断と調整に集中できるようになったからです。

第 2 レイヤー:ハードルの低下

すべての人がデザイナーではありませんが、プレゼンをする必要は誰にでもあります。Nano Banana 2 + Gemini 3 の組み合わせは、非専門家でも「十分に良い」ビジュアルを作れるようにします。デザインは一部の人だけの特権ではなくなります。

第 3 レイヤー:パラダイムシフト

最も深い影響です。従来のワークフローは線形でした。先に内容を書き、次に画像を作り、最後にレイアウトする。各工程は前の工程の完了を待つ必要がありました。

新しいワークフローは並列的で反復的です。先にビジュアルの方向性を生成し、そこから内容構造を調整することもできます。複数のスタイルを同時に試し、素早く比較することもできます。AI に複数バージョンを作らせ、人間が最終選定を行います。

クリエイティブ作業の中心は「実行」から「キュレーション」へ移り変わる——すべての要素を手作業で作るのではなく、方向を定義し、案を選び、細部を調整することが重要になります。

もちろん、デザイナーが失業するわけではありません。むしろトップデザイナーの価値はさらに高まるでしょう。審美眼、発想力、ブランド理解は AI を導く「メタ能力」になり、反復的な実行作業はツールに任せればよいのです。

おわりに

冒頭の水曜日の午後に話を戻しましょう。

従来のやり方なら、その夜は間違いなく残業で PPT 作りに追われていたでしょう。新しいワークフローを使ったおかげで、期限どおりに仕上げたうえ、リハーサルと Q&A の準備にも時間を充てられました。

翌日のプレゼンはスムーズに進みました。投資家からの技術的な質問にも、すぐに該当するアーキテクチャ図を見せながら説明できました。それらの図は、どこかから拾ってきた汎用素材ではなく、うちの製品向けにカスタマイズした、論理の明確なビジュアルでした。

Nano Banana 2 と Gemini 3 は単なるツールではありません。新しい「創作のパートナー」です。あなたの創造性を奪うのではなく、より速く、より容易に現実のものにしてくれます。

まだ試したことがなければ、小さなプロジェクトから始めてみてください。来週のチーム共有スライドで、NotebookLM でアウトラインを出し、Nano Banana 2 で数枚の画像を作ってみる——それで十分です。

最初から完璧ではないかもしれません。でも AI が「実行」の重荷を肩代わりしてくれたとき、あなたが「本当に大切なこと」——ストーリーを語り、観点を伝え、聴衆を動かすこと——に集中できることに驚くはずです。

それこそが、創作の本質なのですから。

FAQ

Nano Banana 2 とは何ですか? 以前の画像生成モデルと何が違いますか?
Nano Banana 2 は、Google が 2026 年 2 月 26 日に発表した最新の画像生成モデルで、技術的には Gemini 3.1 Flash Image に相当します。

主なアップグレード:
• **速度向上**:Pro 版と比べ生成速度が大幅に向上し、大量制作に向く
• **柔軟な解像度**:512px から 4K まで、さまざまなアスペクト比に対応
• **キャラクターの一貫性**:キャラクターとスタイルを揃えたシリーズ画像を生成できる
• **SynthID ウォーターマーク**:AI 生成物の識別・追跡を容易にする透かしを内蔵

初期モデルが「おもちゃ」寄りだったのに対し、Nano Banana 2 は「プロダクション級ツール」へ進化し、商用シーンに適しています。
Nano Banana 2 で良いプロンプトを書くコツは?
プロンプトを書くときの要点:

**スタイルを具体的に**:
• 「かっこいい」ではなく「フラットイラスト」や「3D レンダリングの質感」と書く
• 画風を指定:「サイバーパンク」「ミニマリズム」「アール・ヌーヴォー」

**用途を明示**:
• 「スライド背景用。文字を載せる余白を空けて」
• 「アプリアイコン向け。シンプルで識別しやすく」

**配色をコントロール**:
• 主色を直接指定:「ブランドブルー #1E90FF と白」
• 雰囲気で伝える:「温かみのあるアースカラー」「冷たい青紫グラデーション」

**参照を示す**:
• 「Apple の発表会のようなビジュアル」
• 「Notion 公式サイトのイラストのような質感」

描写が具体的なほど、期待に近い結果が得られます。
スケッチ駆動の AI 生成ワークフローとは?
スケッチ駆動ワークフローの主要ステップ:

1. **手書きスケッチ**:紙に構造(四角、矢印、ラベル)を描く
2. **撮影してアップロード**:スマホで撮影し、Gemini 3 に送る
3. **要件を説明**:求めるスタイルと用途を伝える
4. **AI 生成**:Gemini がスケッチの論理構造を理解し、Nano Banana 2 がプロ品質のビジュアルを生成
5. **反復改善**:修正点を指示し、再生成する

このワークフローの強み:
• スケッチの「意図」を保ちつつ「表現」をアップグレード
• プロダクトマネージャーが素早くアイデアを検証できる
• デザイナーはゼロからではなく仕上げから始められる
• 数ラウンドの反復で実用レベルに到達できる
NotebookLM と Google Slides API をどう組み合わせてスライドを自動化する?
完全自動化ワークフロー:

**NotebookLM フェーズ**:
• 製品ドキュメントや技術白書などのソースをアップロード
• 指示:「投資家向けプレゼンのアウトラインを生成。技術アーキテクチャと市場展望を重視して」
• 出力:構造化されたページ構成と各ページの要点

**Nano Banana 2 フェーズ**:
• 各ページの内容に合わせたビジュアル素材を生成
• ページ種別に応じてスタイルを変える(表紙、チャート、挿絵)

**Google Slides API フェーズ**:
• API で新規プレゼンテーションを作成
• スライドを一括追加
• NotebookLM が生成した文案を挿入
• Nano Banana 2 が生成した画像を挿入
• レイアウトと書式を自動適用

最終出力:構成・内容・ビジュアルが揃ったプロ品質の初稿。あとは微調整するだけ。
AI 自動化はクリエイティブワーカーに何を意味する?
AI 自動化がもたらす 3 層の変化:

**効率の層**:実行速度が大幅に向上。反復作業は AI に任せ、人は判断と調整に集中

**ハードルの層**:非専門家でも「十分に良い」ビジュアルを作れる。デザインは一部の人だけのものではなくなる

**パラダイムの層**:線形ワークフローから並列・反復型へ
• 複数のビジュアル方向を同時に探索できる
• 生成 → 選別 → 改善のサイクルを高速化
• クリエイティブの中心が「実行」から「キュレーション」へ

**デザイナーへの影響**:
• 基礎的な実行作業は減る
• 審美眼、発想力、ブランド理解などの「メタ能力」の価値が高まる
• トップデザイナーは「画工」ではなく AI の「監督」になる

重要な認識:AI は創造性を置き換えるのではなく、創造をより早く形にする。

4分で読めます · 公開日: 2026年2月28日 · 更新日: 2026年6月1日

関連記事

コメント

GitHubアカウントでログインしてコメントできます