Veo 3 カメラワーク制御:7 種類のショット言語で AI 動画を映画級に
先週、Veo 3 でクライアント向けの製品動画を作りました。プロンプトも丁寧——被写体、環境、光まで書き込んだのに、生成結果はスライドのように静止したまま。他のクリエイターの作品と比べると、ドリーインやトラッキング、周回といったカメラワークの差は歴然でした。
調べてみると、鍵は dolly shot、tracking shot、crane shot といった「カメラ制御ワード」にありました。これらは AI 動画と「映画級の質感」のあいだにある扉です。よく使う 7 種類のカメラワークと、プロンプトのコツを押さえれば、動画は一段上がります。
この記事では、7 種類のショット言語をできるだけわかりやすく解説します。それぞれにコピペできるテンプレートと、私が踏んだつまずきから学んだ回避ガイドも付けています。
なぜ AI 動画に映画感が足りないのか?
AI はデフォルトで「安全なショット」を選ぶ
AI 動画って、画質は高いのに何か物足りない——そう感じたことはありませんか? 問題は画質ではなく、カメラが動いていないこと です。
プロンプトでカメラの動きを明示しないと、Veo 3 は最も無難な静止ショットか、単純な左右パンを返してきます。タクシーに行き先を言わなければ、ドライバーは待機するしかないのと同じで、AI も求めているショットがわからず、保守的な選択肢しか出せません。
Google 公式ガイドにもこうあります。“If you want the camera to move, you need to say so clearly in your prompt.”(カメラを動かしたいなら、プロンプトではっきりそう書く)——シンプルですが、ここでつまずく人が多いです。
映画感を生む 3 つの要素
プロの映画監督が頼るのは、カメラワーク + 構図 + 光と影 の 3 つ。AI 動画も同じです。
いちばん効果が出やすいのがカメラワーク。ハリウッド大作のオープニングで、遠景からゆっくり寄って主人公の顔に焦点が合う——それが dolly-in(ドリーイン)。カーチェイスでカメラが主人公を追うのが tracking shot(トラッキングショット)。これらは感情と物語のリズムを伝えます。
AI 映画クリエイターの JimHuiHui 氏が共有したデータでは、AI 生成クリップの素材尺はだいたい 3〜5 秒。不具合を除くと 有効尺は 1〜2 秒 だけ。この短い時間こそ、カメラワークが効きます。静止画は貴重な秒数を無駄にし、設計された運鏡は一瞬で雰囲気を引き上げます。
「カメラを前に」と書いても動かない理由
私も最初は同じでした。“camera moves forward”(カメラが前進する)と書いても、生成結果はほとんど動きません。
原因は プロンプトの書き方 にあります。カメラの動きと被写体の動作を 1 文に混ぜると、AI が優先順位を取り違えがちです。
例えばこう書くと:
❌ 「男性が走っていて、カメラが前に進む」
AI の解釈:重要なのは走る男性。カメラは適当でいい。
こう書くと:
✅ “Slow dolly-in shot. 男性が走っている。”
カメラワークを独立した文として先頭に置けば、AI は「ドリーショットが主役、被写体は走る男性」と理解します。効果は全然違います。
押さえるべき 7 種類のカメラワーク(テンプレート付き)
本題に入りましょう。難易度の低い順に並べています。まずは最初の 3 つから練習するのがおすすめです。
1. Dolly-in / Dolly-out(ドリーイン/ドリーアウト)
動き方:カメラがレール上を滑らかに前後移動します。
いつ使うか:
- Dolly-in(寄る):ディテールに焦点を当て、緊張感を出す。探偵が決定的な手がかりに気づき、カメラがゆっくり目に迫る——といった場面。
- Dolly-out(引く):全体像を見せ、感情を解放する。山頂に立つ主人公から、壮大な風景全体へ引いていく——といった場面。
プロンプトテンプレート:
Slow dolly-in shot, focusing on [被写体], background gradually blurs, creating intimacy. Cinematic, golden hour light.
実例(そのまま使えます):
Slow dolly-in shot, focusing on a scientist staring at a glowing test tube, background gradually blurs, mysterious green light illuminates his face. Cinematic, dramatic lighting.
経験談:ドリーショットは成功しやすく、効果も出やすいです。“slow”(ゆっくり)を忘れずに。ないと AI が猛スピードで突っ込んできます。
2. Tracking Shot(トラッキングショット)
動き方:動く被写体についてカメラが移動します。見えないカメラマンがずっと付いているイメージ。
いつ使うか:アクション、動きのあるシーン、没入感が欲しいとき。走る、走る、歩く——被写体が動いていれば tracking shot で追えます。
プロンプトテンプレート:
Smooth tracking shot following [被写体] as they [動作], [環境の詳細]. Cinematic, steady cam effect.
実例:
Smooth tracking shot following a cyclist speeding down a mountain trail, dust flying, trees rushing past in the background. Cinematic, motion blur, afternoon light.
Dolly と Tracking の違い(混同しやすい):
- Dolly Shot:主に前後の押し引き(奥行きの変化)
- Tracking Shot:被写体について行く(方向は問わない)
覚え方:Dolly = 押し引き、Track = 追跡。
3. Crane Shot(クレーンショット)
動き方:カメラがエレベーターのように垂直に昇降します。
いつ使うか:壮大なシーンや空間関係を見せる。オープニングの establishing shot に特に向いています。
プロンプトテンプレート:
Crane shot rising from [起点] revealing [目的地/全景]. Epic, cinematic.
実例:
Crane shot rising from a close-up of a woman's face, revealing a vast futuristic cityscape at sunset. Epic, sci-fi, golden hour.
4. Aerial View(エアリアルビュー/空撮)
動き方:鳥瞰視点、上から見下ろします。
いつ使うか:「神の視点」が欲しいとき。森、都市、海——壮大なシーンすべてに向きます。
プロンプトテンプレート:
Aerial view of [シーン], camera slowly [移動方向]. Cinematic, drone shot.
実例:
Aerial view of a dense forest with a winding river, camera slowly moving forward. Cinematic, drone shot, morning mist.
注意:空撮は動きがなくても映画的です。静止の鳥瞰も十分効きます。
5. Pan(パン)/ Tilt(チルト)
動き方:カメラ位置は固定のまま、左右(pan)または上下(tilt)に回転します。
いつ使うか:新情報や空間を見せる。窓の外の景色から室内の人物へパン——「あ、主人公はここにいたのか」と気づかせる。
プロンプトテンプレート:
Slow pan [方向] from [起点] to [終点], revealing [明らかにしたい内容].
実例:
Slow pan right from a rainy window to a woman sitting alone with coffee, melancholic mood. Cinematic, soft light.
6. POV Shot(主観ショット)
動き方:キャラクターの目線から見た視点。
いつ使うか:強い没入感が欲しいとき。一人称で、観客をキャラクター本人にします。
プロンプトテンプレート:
POV shot from [キャラクター]'s perspective, [見えている内容]. Immersive, first-person view.
実例:
POV shot from driver's perspective, highway rushing towards camera at high speed, hands visible on steering wheel. Immersive, motion blur.
小技:没入感を上げたいなら “slight handheld shake”(わずかな手ブレ)を加えると、人間の目に近い揺れになります。
7. Dolly Zoom(ドリーズーム/めまいショット)
動き方:カメラが前進しながらズームアウト(またはその逆)。被写体サイズは保ち、背景だけが歪みます。
いつ使うか:衝撃、恐怖、気づきの瞬間。ヒッチコックが『めまい』で恐高症を表現したあの技法です。
プロンプトテンプレート:
Dolly zoom effect on [被写体], background [warps/distorts], creating [感情]. Dramatic, cinematic.
実例:
Dolly zoom effect on a man's shocked face, background warps and distorts, creating vertigo and tension. Dramatic, thriller style.
正直なところ、これは最も難しく、AI が正確に再現するとは限りません。成功すれば効果は抜群なので、何度か試す価値はあります。
プロンプトを書く 5 つのポイント
7 種類を知ったら、プロンプトへの書き方が次のステップです。この 5 つで、AI の理解と実行率が大きく上がります。
ポイント 1:カメラワークは独立した文にする
繰り返しになりますが、ここが最重要です。
悪い例:
雨の中を走る男性、カメラがゆっくり近づき、背景は都会の夜景
良い例:
Slow dolly-in shot. A man running in the rain, city night lights in the background.
カメラ指示は切り出して先頭へ。AI は順番に読むので、早く書いたほど優先されます。
ポイント 2:速度と強度を具体的に書く
「カメラが動く」だけでは AI はランダムに動きます。どう動くか を指定しましょう。
曖昧:camera moves(カメラが動く)
明確:slow smooth pan right(ゆっくり滑らかに右へパン)
よく使う修飾語:
- 速度:slow(遅い)、rapid(速い)、gentle(穏やか)、sudden(突然)
- 質感:smooth(滑らか)、steady(安定)、handheld(手持ち風)、shaky(揺れ)
同じ dolly-in でも:
- “slow dolly-in” = ゆっくり寄り、雰囲気を作る
- “rapid dolly-in” = 急速に迫り、衝撃を与える
まったく別の印象になります。
ポイント 3:主なカメラワークは 1 つだけ
欲張らないでください。こう書く人がいます:
❌ 「カメラが前進しながら回転し、上昇もする」
AI は混乱し、どれとも言えない映像になります。プロの撮影でも 1 ショットにこれだけ詰め込みません。
1 回 1 つの主運動。複雑な効果が必要なら、複数ショットに分けて後から編集でつなぎましょう。
ポイント 4:プロンプトは 100〜150 語に収める
短すぎると情報不足、長すぎると要点を逃します。
目安:3〜6 文、100〜150 語 です。
Google 公式ガイドの構造:
- ショットタイプ(1 文)
- 被写体と動作(1〜2 文)
- 環境と雰囲気(1〜2 文)
- ビジュアルスタイル(1 文)
例(ちょうど 4 文):
Slow tracking shot following the subject. A young woman walking through a sunflower field at sunset. Golden light, lens flare, gentle breeze moving the flowers. Cinematic, dreamlike atmosphere.
ポイント 5:光と環境も書く
カメラワークだけでは映画感は半分。光と雰囲気 もセットで。
“dolly-in shot” だけより、次のように書くと一気に変わります:
Slow dolly-in shot. Golden hour light, lens flare, soft shadows. Cinematic, warm tones.
光のキーワード:
- golden hour(ゴールデンアワー)
- soft light(柔らかな光)
- dramatic lighting(ドラマチックな照明)
- lens flare(レンズフレア)
- backlit(逆光)
- neon glow(ネオンの輝き)
雰囲気のキーワード:
- cinematic(映画的)
- moody(ムーディ)
- dreamlike(夢のような)
- gritty(粗い/リアル)
- ethereal(幻想的)
これらとカメラワークを組み合わせて、初めて「映画の言語」が完成します。
よくある質問とつまずき回避
Q1: カメラワークを書いたのに実行されない
原因:他の要素に埋もれている。
対策:カメラワークをプロンプトの 前半 1/3 に置き、優先度を上げる。
比較:
❌ 低優先度:
薄暗い実験室で働く科学者、周囲は機器だらけ、slow dolly-in shot
✅ 高優先度:
Slow dolly-in shot. A scientist working in a dimly lit lab, surrounded by instruments.
ショットタイプを最初に書けば、AI が最初に読み取り、実行率が上がります。
Q2: 運鏡が速すぎる/遅すぎる
対策:速度修飾語を足す。
- 速すぎる → “slow”、“gentle”、“gradual”
- 遅すぎる → “rapid”、“dynamic”、“swift”
“3-second dolly-in”(3 秒かけて寄る)のような時間指定も使えますが、AI の解釈は不安定。slow/rapid の方が確実です。
Q3: Dolly Shot と Tracking Shot の見分け方
RED(小紅書)で少なくとも 20 回は見かけた質問です。
覚え方:
- Dolly Shot:前後に押し引き(レール上のカメラ車は前後しか動けない)
- Tracking Shot:被写体について行く(スタビライザーで追いかける)
使い分け:
- 被写体は動かず、近づきたい → Dolly-in
- 被写体が動いていて、追いたい → Tracking Shot
例:
- 花が静かに咲く、カメラがゆっくり寄る → Dolly-in
- 人が森を走る、カメラも一緒に走る → Tracking Shot
Q4: 同じプロンプトでも毎回結果が違う
答え:AI のランダム性で、完全には避けられません。
私のやり方:
- 同じプロンプトで 3〜5 回生成
- いちばん良いものを選ぶ
- 満足できなければプロンプトを微調整して再試行
上級テクニックとして JSON 形式プロンプト もあります。2025 年 7 月ごろ、JSON 構造の方がプレーンテキストより 30% 効果が高いという報告があり、パラメータ制御が精密になります。ただし複雑なので、慣れてから試すのがよいでしょう。
Q5: AI が意図を誤解し続ける
よくある原因:曖昧な表現。
“camera moves forward”(カメラが前に動く)の場合:
- あなたの意図:視線方向へ寄る(dolly-in)
- AI の解釈:上昇(crane up)かも、追従(tracking)かも
曖昧さを避ける:専門用語をそのまま使う。
- “camera moves forward” ではなく → “dolly-in shot”
- “camera follows” ではなく → “tracking shot”
複雑に見えても、AI にとってはむしろ明確です。
上級テクニック:分鏡(ストーリーボード)思考
AI 動画をもう一段上げたいなら、分鏡思考 で設計する必要があります。
8 秒を 4 つの 2 秒ショットに分ける
Veo 3 の 1 クリップは最大 8 秒(一部ユーザーはもっと長く生成できますが、多くは 8 秒)。プロは 8 秒を複数ショットに分け、各ショットに 1 つの焦点を置きます。
分鏡例:
テーマ:「燃える森からの脱出」
- 0〜2 秒:Handheld shaky shot、走る主人公のクローズアップ、荒い息
- 2〜4 秒:Rapid dolly-in、恐怖に満ちた顔へ急速に寄る
- 4〜6 秒:Low angle crane shot、燃える幹を煽りで撮り、危機感を演出
- 6〜8 秒:Wide tracking shot、森の端から飛び出し、カメラへ向かって跳ぶ
2 秒ごとに感情が切り替わり、テンポは極めてタイトです。
なぜこう設計するか:AI 映画クリエイターの共有によると、1 ショットの有効尺は 1〜2 秒(冒頭・末尾の不具合を除く)。なら、テンポの速い編集スタイルで各ショットの情報密度を上げた方が合理的です。
編集で AI の不安定さを補う
同じプロンプトでも、1 回目は完璧、2 回目は失敗——AI 動画の常です。
私のフロー:
- 短いショットを個別に生成(1 ショット 1 プロンプト)
- 各ショットを 3〜5 回生成し、ベストを選ぶ
- Premiere、Final Cut、CapCut などでつなぐ
1 本の完璧な長回しを追うより、こちらの方が現実的です。
複数のショット言語を組み合わせる
完成度の高い動画には、カメラワークの組み合わせとリズム変化が必要です。
定番構成:
- オープニング:Aerial view または Crane shot で場所を示す
- 中盤:Dolly-in または Tracking shot で動作を追う
- クライマックス:Dolly zoom または Rapid dolly-in で衝撃
- エンディング:Dolly-out または Crane shot で余韻
実例:「カフェの朝」
1. Aerial view of a cozy cafe at sunrise, warm light. (場所を示す)
2. Slow dolly-in to a cup of steaming coffee on the table. (ディテール)
3. Tracking shot following the barista's hands making latte art. (動作)
4. Crane shot rising from the cup, revealing the whole cafe. (余韻)
4 ショット × 各 2 秒。つなげれば小さな物語になります。
優れた事例から学ぶ
中国製 AI 映画『万里星河千帳灯』の制作フローは参考になります:
- AI 生成のストーリーボードを Runway に取り込み動画化
- 特殊効果(ロケット垂直着陸など)はモーションブラシで精密制御
- 編集でテンポ調整・加速処理
学ぶべきは 先に分鏡を設計し、次に生成し、最後に編集で整える という流れ。1 発完璧を狙わず、段階的に制御するのが王道です。
まとめ
長くなりましたが、要点は一言:カメラが動いて初めて、動画に魂が宿る。
7 種類の実用ショット——dolly-in、tracking shot から dolly zoom まで——と、プロンプトの 5 ポイント、よくあるつまずきの回避法を押さえました。
今日から、AI 動画は「静止 PPT」ではなくなります。
いきなり全部使おうとしないでください。まず dolly-in か tracking shot から、10 回、20 回と試して感覚を掴む。慣れたら crane shot や dolly zoom に進みましょう。
覚えておいて:複雑であるほど良いわけではありません。伝えたい感情に合うかが大事です。
- 親密感 → dolly-in でゆっくり寄る
- 躍動感 → tracking shot で追う
- 衝撃 → dolly zoom を一発
ショットを選び抜けば、8 秒のショートでも大作級の雰囲気が出せます。
試してみて、作品を RED や X に投稿してみてください。次のバズクリエイターは、あなたかもしれません。
FAQ
なぜ Veo 3 で生成した動画には映画感がないのですか?
プロンプトでカメラの動きを明示しないと、Veo 3 はデフォルトで静止ショットを生成します。
Google 公式ガイドにもこうあります:
'If you want the camera to move, you need to say so clearly in your prompt.'
カメラワークは独立した文として先頭に置くと、実行率が大きく上がります。
7 種類のカメラワークとは何ですか?
• ディテールに寄る、または全体像を見せる
2) Tracking Shot(トラッキングショット):
• 動く被写体を追う
3) Crane Shot(クレーンショット):
• 垂直に昇降し、壮大なシーンを見せる
4) Aerial View(エアリアルビュー):
• 鳥瞰視点
5) Pan/Tilt(パン/チルト):
• 左右または上下に回転
6) POV Shot(主観ショット):
• 一人称視点
7) Dolly Zoom(ドリーズーム):
• 衝撃的な効果を生み出す
AI にカメラワークを正確に実行させるには?
1) カメラワークは独立した文として先頭に置く
2) 具体的な速度・強度の修飾語を使う(slow、rapid、smooth など)
3) 一度に使う主なカメラワークは 1 つだけ
4) プロンプトの長さは 100〜150 語に抑える
5) 光と環境の描写を組み合わせる
ショットタイプを最初に書けば、AI が最初に読み取り、実行率がすぐ上がります。
Dolly Shot と Tracking Shot の違いは?
• カメラが前後に移動する(レール上のカメラ車が前後にしか動けないイメージ)
• 被写体は動かず、カメラを近づけたいとき向き
Tracking Shot:
• カメラが被写体について行く(スタビライザーで追いかけるイメージ)
• 被写体が動いていて、一緒に動きたいとき向き
覚え方:Dolly = 押し引き、Track = 追跡。
カメラワークを書いたのに AI が実行しないのはなぜ?
解決策:
• カメラワークをプロンプトの前半 1/3 に置き、優先度を上げる
• ショットタイプを最初に書くと、AI が最初に読み取り、実行率が上がる
例:
• 正解:'Slow dolly-in shot. A scientist working in a dimly lit lab.'
• 誤り:カメラワークを最後に置く
カメラワークの実行効果を高めるには?
1) 専門用語を使う(camera moves forward ではなく dolly-in shot)
2) 速度の修飾語を加える(slow、gentle、rapid)
3) 光と環境の描写を組み合わせる(golden hour light、cinematic など)
JSON 形式のプロンプトはプレーンテキストより効果が 30% 高く、パラメータをより正確に制御できます。ただし複雑なので、慣れてから試すのがおすすめです。
6分で読めます · 公開日: 2025年12月4日 · 更新日: 2026年6月8日
Veo3 完全ガイド
検索からこのページに来た場合は、前後の記事もあわせて読むと同じテーマの理解がかなり早く深まります。
前の記事
Veo 3の月額料金は?Pro/Ultraプラン比較と節約ガイド
Veo 3サブスク完全解説:Pro($19.99/月)とUltra($249.99/月)の比較、クレジット消費ルール、隠れコスト、節約術まで。無駄な出費を防ぐプラン選びと、Runway・Pika など主要 AI 動画ツールとの価格比較も収録。
第 2 / 9 記事
次の記事
Veo 3 音声生成完全ガイド:AI 動画にセリフと BGM を自動付けする方法(プロンプトテンプレート付き)
Veo 3 の音声生成機能を徹底解説。会話から効果音、BGM まで、実用的なプロンプトテンプレートと 5 つのよくある問題の解決策を紹介し、AI 動画に音声を自動で付けます。
第 4 / 9 記事
関連記事
Veo 3 プロンプトの書き方:5 要素公式+10 テンプレートで映画級動画を生成
Veo 3 プロンプトの書き方:5 要素公式+10 テンプレートで映画級動画を生成
Veo 3 キャラクター一貫性完全ガイド:Scenebuilder で繋がるマルチショット動画を作る
Veo 3 キャラクター一貫性完全ガイド:Scenebuilder で繋がるマルチショット動画を作る
Veo 3 画像から動画の実践:Reference Image で動画を精密に制御する
コメント
GitHubアカウントでログインしてコメントできます