GoogleのMotion Promptingは運動軌道を用いたビデオ生成を制御する技術

Google DeepMind の動画 Motion Prompting 研究は、運動軌道を用いて動画生成を制御し、その核心的な目標は運動情報を活用して生成システムを設計し、より柔軟で制御可能な動的ビデオコンテンツの生成を実現することです。

軌道に基づく条件付きビデオ生成モデルの訓練

  • 運動を表現する:
    • この柔軟な運動表現は、単一または複数の点軌跡をエンコードすることをサポートします。
    • 特定のオブジェクトや全体シーンの運動を記述することができます。
    • 遮蔽(occlusion)や時間的にスパースな運動シーケンスも含みます。

方法手順

  1. 軌道に基づく条件付きビデオ生成モデルの訓練を行います。

  2. 運動プロンプトを使用してモデルが目的の動作を生成するように誘導します。

比較分析