のテキストプロンプト 人工知能ビデオ 世代によっては、動き、カメラの動き、ビジュアルスタイルを制御できないことが多く、その結果、一貫性のない、または不自然なビデオが生成されます。「シネマティック・ショット」や「ダイナミックな動き」のような明確な説明でも、AI モデルによって解釈が異なることがあります。
それが理由です ビデオリファレンス は不可欠です。これにより、クリエイターは実際の動画を使って動き、カメラワーク、雰囲気を正確に導くことができます。このガイドでは、その内容について説明しています。 ビデオリファレンス は、その仕組み、そして簡単な使い方です ビデオリファレンスワークフロー に アコール。
ビデオリファレンスとは
ビデオリファレンスは AI ビデオ生成の機能で、既存のクリップを使用して、新しく生成されたビデオの動き、カメラの動き、スタイルをガイドします。
覚えやすい簡単な数式の中核となるアイデアは次のとおりです。
ビデオリファレンス How(モーション、スタイル)を制御し、テキストプロンプトはWHAT(主題、シーン)を制御します。
簡単な比較例
- テキストプロンプトのみ: 「踊るロボット。」
- テキストプロンプト + ビデオリファレンス (バレエダンサーのクリップ): 「バレエ公演のような正確で優雅な動きで踊るロボット。」
同じ「WHAT」(ロボットダンス)。「HOW」(バレエの動き) が全然違う。
大胆なテイクアウト: テキストプロンプトがスクリプトなら、ビデオリファレンスは振り付け+カメラリハーサルです。
ビデオリファレンス AI の主なスーパーパワー
クリエイターが使用するインパクトの大きい 3 つの方法を次に示します。 ビデオリファレンス AI 実際のプロジェクトでは(鮮明な例があれば盗むことができます)。

A. パーフェクト・モーション&アクション・レプリケーション
これが「コピー・ザ・パフォーマンス」の超能力です。
モデルが適切なアクションを発明することを期待するのではなく、すでに機能しているモーションをモデルにフィードし、新しい主題、シーン、またはブランドアイデンティティを入れ替えます。
鮮明な例:
友人が楽しい8秒間のダンスをしている様子を携帯電話で録音します。次に、以下を生成します。 プロフェッショナル・アニメーション・ミュージック・ビデオ 定型化されたブランドマスコットが出演する場所 まったく同じ動き—クリーン、リズミカル、そしてオンビート。
これが輝くところ:
- ブランドキャラクターを使ったTikTok/Reelsトレンドジャッキング
- UGCを洗練されたキャンペーンコンテンツに変える
- 製品の「動きのデモ」(注ぐ、箱を開ける、ひっくり返す、投げる)
被写体よりも動きの方が重要な場合は、ビデオリファレンスを使用してください。
B. シネマティック・カメラ・ワーク・トランスファー
これがあなたのやり方です カメラの動きをコピー—「ディレクターモード」のアップグレード。
リファレンスクリップでガイドできます 感じる ショットの:
- スロードリーインテンション
- 抜本的なドローン公開
- ハンドヘルド・イージェンシー
- スムーストラッキングショットエネルギー
鮮明な例:
ネイチャードキュメンタリーの象徴的なドローンの動きが好きですね。このリファレンススタイルを使って、カメラが物件の上を滑空し、入り口に向かって傾き、裏庭が見える不動産ショットを生成します。それと同じ映画的な勢いで。
これはまさに、学術研究でも研究されている「参照クリップからの映画的転送」であり、参照クリップから新しく生成されたクリップに映画の特徴を転送することです。
C. ビジュアルスタイルと雰囲気のクローニング
これは「スタイル転送動画」ですが、 バイブ色だけじゃない
リファレンスクリップは次のことを伝えるのに役立ちます。
- 照明ムード (ネオン、暖かい夕焼け、強い蛍光灯)
- 質感と「時代」(フィルムグレイン、VHSノイズ、デジタルシャープネス)
- 全体的な美的一貫性(クリップがずれないように)
鮮明な例:
クリーンでモダンなポッドキャストの録音ができました。ビデオリファレンスを使えば、ざらざらしたようなものに変換できます。 1980年代 VHS テープ—ソフトコントラスト、スキャンライン、テープノイズ、そしてノスタルジックで少し幽霊のようなアナログ感。
ステップバイステップ:Akoolでビデオリファレンスを使用する方法
Akoolは複数の高度なビデオモデル(次のような名前を含む)を統合します クリング、ソラ、ミニマックス、シーダンス、ワン)1つのプラットフォームエクスペリエンスで。
また、AkoolのKling O1ワークフローでは、具体的に使用方法を説明しています スタイルと動きをガイドするリファレンスクリップとキーフレームこれがまさにビデオリファレンスのアイデアが実際に使われているものです。
以下は、実行できる実用的なワークフローです。
ステップ 1: ソースビデオを選択してください
転送したいモーション/カメラ/スタイルがはっきりとわかるクリップを選んでください。
ベスト・プラクティス:
- 件名をクリア: アクションを行うメインの人物/オブジェクト(混雑したシーンは避けてください)
- 強くて読みやすい動き: 大きなジェスチャーは小さな微小な動きに勝る
- 良い照明: クリーンな露出により、モデルは何が重要かを「見る」ことができます
- 安定したフレーミング (動きが重要な場合): 被写体の動きを再現したい場合は、カオスのような手ぶれを避けてください
- 短く集中できる: 多くの場合、より長い世代より前のテストには3~8秒が理想的です
プロのヒント: 1つのアクション、1つのショット、1つのバイブ、つまり「1つのアイデア」のクリップから始めましょう。
ステップ 2: コンパニオンテキストプロンプトを書く (モーションはリファレンスに任せる)
プロンプトの役割は、以下を定義することです 何:
- 件名
- セッティング
- 小道具
- 時間帯
- ブランドバイブ
リファレンスクリップで定義させてください どうやって:
- ザ・モーション・リズム
- カメラ移動パターン
- 一般的なペーシング
再利用可能なプロンプトテンプレート:
件名: (画面に表示されているユーザー/内容)
シーン: (彼らがいる場所)
ビジュアルスタイル: (シネマティック/アニメ/レトロ/クリーンコマーシャル)
制約: (アイデンティティの一貫性を保ち、ちらつきや余計な手足は発生しません)
プロンプトの例 (ダンスモーションリファレンス):
「新製品発表会でネオンに照らされたステージで踊る愛らしい3Dブランドマスコット、シネマティックな照明、すっきりとしたアニメーション、エネルギッシュで安定したキャラクターデザイン。」
ステップ 3:「強度」/「体重」パラメータをマスターする
ほとんどのビデオリファレンスワークフローには、出力がリファレンスにどれだけ強く従うかを制御するスライダーまたは設定が含まれています。
こんな風に考えてみてください DJ クロスフェーダー の間:
- リファレンス・フィデリティ (クリップをぴったり合わせてください)
- クリエイティブな自由 (より多くの新しいモーション/スタイルを発明してください)
Akool関連のモデルガイドでも、このコンセプトが次のように組み立てられていることがよくあります 創造性と関連性 制御 — つまり、モデルが迷い込むのではなく、ガイダンスにどれだけ厳密に従っているかということです。
実践的なガイダンス (ほとんどのツールで動作):
- 低強度(より創造的): 欲しいときに最適 バイブ しかし、正確な動きではありません。
- 中強度 (バランス): マーケティングコンテンツの出発点として最適です。
- 高強度(より忠実): 特定の振り付けやカメラブロッキングを再現するのに最適です。
出力が「モデル外」に見える場合は、強度を上げてください。「コピーしすぎている」ようであれば、下げてください。
ステップ 4: 反復処理と リファイン
優れたクリエイターは、ビデオリファレンスを監督のように扱います。
イテレーションチェックリスト:
- 試してみる 2 ~ 3 段階の強度レベル (低/中/高)
- プロンプトをきつく締める (追加) 一 試行ごとの改善)
- 必要に応じてリファレンスクリップを交換してください (リファレンスがボトルネックになる場合もあります)
- 「十分良い」バージョンをエクスポートし、編集に磨きをかける(スタビライズ、アップスケール、サウンドの追加、ビートに合わせたカット)
あなたは「促している」のではありません。テイクをディレクションしているんですね。
結論:
Video Referenceは、AIビデオを「クールなデモ」から「繰り返し使える制作ツール」に変えるアップグレードです。
そして、Akoolは以下を使用するワークフローをサポートしているからです スタイルと動きをガイドするリファレンスクリップとキーフレーム、このアプローチを適用するには実用的な場所です。特に、ランダムなサプライズではなく、一貫した結果を必要とするマーケティングコンテンツを作成している場合はなおさらです。

