テキストから最長60秒の動画を生成するAI「Sora」をOpenAIが発表

上記の動画を生成したプロンプトだそうです。
A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

これまでAIで生成された動画に特有の「奇妙さ」「グロテスクさ」が少なくなってます。背景の群衆が個別に違和感なく歩いてるのがすごいです。

Soraのオフィシャルサイトには下記のように書かれています。詳しく解りませんが説得力があります。

「Soraは、複数のキャラクター、特定の種類の動き、被写体や背景の正確な詳細を持つ複雑なシーンを生成することができます。このモデルは、ユーザーがプロンプトで求めたものだけでなく、それらが物理的な世界にどのように存在するかも理解します。これまでのモデルには弱点があります。複雑なシーンの物理を正確にシミュレートすることに苦労し、原因と結果の具体的な例を理解できない可能性があります。例えば、人はクッキーを齧るかもしれないが、その後、クッキーには齧った跡がないかもしれない。」

Soraのオフィシャルサイトには「安全性」というセクションもあります。
「私たちは、世界中の政策立案者、教育者、アーティストを巻き込み、彼らの懸念を理解し、この新しいテクノロジーのポジティブな使用例を特定します。広範な調査とテストにもかかわらず、私たちは人々が私たちのテクノロジーをどのように使用するか、またどのように悪用されるかをすべて予測することはできません。だからこそ私たちは、実際の使用例から学ぶことが、時間をかけてより安全なAIシステムを作り、リリースしていく上で重要な要素であると考えています。」

新規性や自分たちの技術のアピールではなく、この段階で安全性を前面に出すことは企業の姿勢として公正さと信頼感があると思います。
こういった姿勢を取れないテクノロジーは淘汰されることになるかも。
日本の企業ではとても追いつけないくらい先を進んでいる気がします。

Soraのオフィシャルサイト >>

【関連記事】
AIで制作した短編映画『The Frost』と新しい映像制作

Leave a Comment