OpenAIは10月1日(米国では9月30日)、動画生成AIモデルであるSoraの次期バージョン、「Sora 2」を発表しました。
ファーストインプレッションをお伝えします。
Sora 2とは何か?
2024年初めのティーザー動画では話題を集めたものの正式リリース時には期待はずれに終わってしまっていたSoraを「物理的に正確でリアリスティックかつ制御しやすく」大幅に刷新したもので、音声も付加されます。
最大の新機能は「Cameo」。人物やペットなどのキャラクターをSoraで生成した動画にカメオ出演させる機能で、登録するにはSoraアプリで短い動画と音声を収録する必要があります。なりすましを防ぐ方策も施されています。他の人が作成した動画にカメオ出演することが可能である一方、自分のカメオがどのように使われるかをコントロールすることもできます。
この機能を活用して他の人の作品に登場するなど、コミュニティ機能も備えており、このところAI動画生成に力を入れているTikTokやYouTubeへの対抗意識が窺われます。
米国とカナダではスタートし、日本でも対応となりました。なお、Soraのアカウントを既に持っているユーザーでも招待コードが必要となっています。
招待コードを入手するためにはApp StoreからSoraのiPhoneアプリをダウンロードし、Invitationのリクエストをしておく必要があります。


Sora 2は当面無料ですが、より高性能なSora 2 ProはOpenAIのProアカウント限定。
既にアプリの日本語化はされており、Androidへの対応も予定しています。
Soraは20秒までの動画を生成できるというのが売り物でしたが、実際には10秒付近で破綻してしまうのが大半だったので、安定した動きの生成には今度こそ期待したいところ。
Soraアプリを使えたらどうなるか
公式Discord経由で招待コードを入手できたので、Soraアプリに入力してログインし、使ってみました。
ログインすると、まずカメオの設定に入ります。画面に映し出された2桁の数字を3つ読み上げ、正面、左右上下をランダムに撮影します。
1分ほどで設定が終わったら、カメオを使える人の範囲を設定。SNS機能で相互フォローになっている場合のみ使うといった設定も可能です。
![]() | ![]() | ![]() |
中に入ると、TikTokのような縦動画を上下にフリックしていくユーザーインタフェースで次々にSora 2生成動画が再生されます。
ポケモンキャラもいますが、これは大丈夫なのでしょうか?
![]() | ![]() | ![]() |
次に、自分のカメオ出演を生成してみます。@ユーザー名~のプロンプトで生成します。完成には数分かかりました。
![]() | ![]() | ![]() |
動画の解像度は352 × 640。30FPS、オーディオは96kHzのAACです。長さは10秒。
リップシンクはバッチリですし、本人性もかなり近いと思います。
Sora 2をブラウザから使ってみる
アプリが動くようになったら、ブラウザでもSora 2が使えるようになりました。
画像添付が可能ですが、リアルな人物の画像生成は制限されており、できませんでした。
一方、日本語でのプロンプトは可能で、歌をうたう指定に応えて、日本語歌詞の曲を演奏とともに披露してくれました。
10秒の動画生成には2分ちょっとかかります。Landscapeも指定できますが、画像自体は縦型となっており、まだこなれてはいないようです。1280 × 704と、アプリ版よりも高解像度。
この解像度はLandscapeのみで、縦画像にすると、アプリ版と同様になるみたいです。
これだとSoraのウォーターマークがランダムに表示されるので、使い所は難しいですね。Soraアプリの中ではウォーターマークは出てこないので、SNSの中で使ってね、ということでしょうか。
また、得意だと言っていた物理シミュレーション系はKoguさんにプロンプトをもらって試してみました。
「AAAゲームのプレイ動画」のようなゲームシミュレーションも得意なようです。
ハリウッドB級映画のNGシーンというプロンプトはなかなかよい結果を出しました。
架空のテレビ番組のシーンや映画のトレーラーなんかも完成度が高いのですが、これはまずいだろうというものも。「風のちょうちん」……。