Begini Kemampuan Sora AI Mengubah Dunia Visual

Reporter: Jessica Laurent|

Editor: Heti Palestina Yunani|

Rabu 21-02-2024,01:33 WIB

Begini Kemampuan Sora AI Mengubah Dunia Visual

Sora merupakan sebuah model difusi inovatif yang telah menciptakan gelombang baru dalam pembuatan video dengan pendekatan yang unik dan canggih. --OpenAI

HARIAN DISWAY - OpenAI memperkenalkan model AI terbarunya, Sora yang dapat membuat video hanya dengan perintah teks. AI generatif tersebut membantu Anda dalam membuat video yang realistis dan imajinatif sesuai dengan apa yang Anda tulis di deskripsi teks.

Sora merupakan sebuah model difusi inovatif yang telah menciptakan gelombang baru dalam pembuatan video dengan pendekatan yang unik dan canggih.

Prosesnya dimulai dengan video yang awalnya tampak seperti derau statis, tapi dengan kemampuan transformasinya, secara bertahap menghilangkan derau tersebut dalam beberapa langkah, menghasilkan video berkualitas tinggi yang menakjubkan.

Salah satu keunggulan utama dari Sora adalah kemampuannya untuk menghasilkan video secara menyeluruh atau memperluas video yang ada untuk membuatnya lebih panjang.

Dengan menerapkan model pandangan ke depan pada banyak bingkai sekaligus, Sora berhasil memecahkan tantangan kompleks dalam menjaga konsistensi subjek video meskipun dalam beberapa saat subjeknya mungkin tidak terlihat.

Mirip dengan model GPT yang terkenal, Sora juga menggunakan arsitektur transformator yang canggih. Hal ini menghasilkan performa penskalaan yang superior, memungkinkan Sora untuk menghasilkan video dengan kualitas yang sangat tinggi.

Sebagai bagian dari pendekatan inovatifnya, Sora merepresentasikan video dan gambar sebagai kumpulan unit data yang lebih kecil yang disebut patch dan serupa dengan yang digunakan dalam model GPT.

Dengan memadukan cara merepresentasikan data ini, Sora dapat melatih transformator difusi pada data visual dengan berbagai durasi, resolusi, dan rasio aspek, membuka kemungkinan baru dalam pembuatan konten visual.

Sora juga mengembangkan penelitian sebelumnya dalam model DALL-E dan GPT, memanfaatkan teknik recaptioning dari DALL-E 3. Teknik ini melibatkan pembuatan teks yang sangat deskriptif untuk data pelatihan visual.

Dengan pendekatan ini, model Sora dapat dengan setia mengikuti instruksi teks pengguna dalam menghasilkan video yang sesuai dengan keinginan.

Selain kemampuannya untuk menghasilkan video dari instruksi teks, Sora juga mampu mengambil gambar diam yang ada dan menghasilkan video darinya. Proses ini melibatkan animasi konten gambar dengan akurat dan memperhatikan detail kecil, menciptakan hasil yang menakjubkan.

Cek Berita dan Artikel yang lain di Google News

Sumber:

Terkini

Usai The Odyssey, Christopher Nolan Butuh Jeda 3 Tahun untuk Film Baru

Cara Nonton BTS di Piala Dunia 2026, Dari TVRI hingga Streaming Resmi

Lebih Dekat dengan Gerakan Save Street Child Surabaya: Bertahan Berkat Empati Para Relawan

Man United Tumbang 0-1 dari Wrexham, Andrey Santos Tampil Menjanjikan

Bukayo Saka Jadi Pahlawan Inggris, Ogah Bahas Minute Play dan Keputusan Tuchel

Terpopuler

Pilihan