Begini Kemampuan Sora AI Mengubah Dunia Visual

 Begini Kemampuan Sora AI Mengubah Dunia Visual

Sora merupakan sebuah model difusi inovatif yang telah menciptakan gelombang baru dalam pembuatan video dengan pendekatan yang unik dan canggih. --OpenAI

HARIAN DISWAY - OpenAI memperkenalkan model AI terbarunya, Sora yang dapat membuat video hanya dengan perintah teks. AI generatif tersebut membantu Anda dalam membuat video yang realistis dan imajinatif sesuai dengan apa yang Anda tulis di deskripsi teks.

Sora merupakan sebuah model difusi inovatif yang telah menciptakan gelombang baru dalam pembuatan video dengan pendekatan yang unik dan canggih.

Prosesnya dimulai dengan video yang awalnya tampak seperti derau statis, tapi dengan kemampuan transformasinya, secara bertahap menghilangkan derau tersebut dalam beberapa langkah, menghasilkan video berkualitas tinggi yang menakjubkan.

BACA JUGA: OpenAI Luncurkan Sora, Model AI yang Bisa Bikin Video Hanya dengan Perintah Teks

Salah satu keunggulan utama dari Sora adalah kemampuannya untuk menghasilkan video secara menyeluruh atau memperluas video yang ada untuk membuatnya lebih panjang.

Dengan menerapkan model pandangan ke depan pada banyak bingkai sekaligus, Sora berhasil memecahkan tantangan kompleks dalam menjaga konsistensi subjek video meskipun dalam beberapa saat subjeknya mungkin tidak terlihat.

Mirip dengan model GPT yang terkenal, Sora juga menggunakan arsitektur transformator yang canggih. Hal ini menghasilkan performa penskalaan yang superior, memungkinkan Sora untuk menghasilkan video dengan kualitas yang sangat tinggi.

BACA JUGA: Fakta Menarik Sora OpenAI, Pesaing Google Lumiere

Sebagai bagian dari pendekatan inovatifnya, Sora merepresentasikan video dan gambar sebagai kumpulan unit data yang lebih kecil yang disebut patch dan serupa dengan yang digunakan dalam model GPT.

Dengan memadukan cara merepresentasikan data ini, Sora dapat melatih transformator difusi pada data visual dengan berbagai durasi, resolusi, dan rasio aspek, membuka kemungkinan baru dalam pembuatan konten visual.

Sora juga mengembangkan penelitian sebelumnya dalam model DALL-E dan GPT, memanfaatkan teknik recaptioning dari DALL-E 3. Teknik ini melibatkan pembuatan teks yang sangat deskriptif untuk data pelatihan visual.

Dengan pendekatan ini, model Sora dapat dengan setia mengikuti instruksi teks pengguna dalam menghasilkan video yang sesuai dengan keinginan.

BACA JUGA:7 Tool AI Gratis Bantuin Pekerjaan Jadi Lebih Mudah Selain ChatGPT

Selain kemampuannya untuk menghasilkan video dari instruksi teks, Sora juga mampu mengambil gambar diam yang ada dan menghasilkan video darinya. Proses ini melibatkan animasi konten gambar dengan akurat dan memperhatikan detail kecil, menciptakan hasil yang menakjubkan.

Cek Berita dan Artikel yang lain di Google News

Sumber: