Begini Kemampuan Sora AI Mengubah Dunia Visual

Rabu 21-02-2024,01:33 WIB

Reporter : Jessica Laurent

Editor : Heti Palestina Yunani

HARIAN DISWAY - OpenAI memperkenalkan model AI terbarunya, Sora yang dapat membuat video hanya dengan perintah teks. AI generatif tersebut membantu Anda dalam membuat video yang realistis dan imajinatif sesuai dengan apa yang Anda tulis di deskripsi teks.

Sora merupakan sebuah model difusi inovatif yang telah menciptakan gelombang baru dalam pembuatan video dengan pendekatan yang unik dan canggih.

Prosesnya dimulai dengan video yang awalnya tampak seperti derau statis, tapi dengan kemampuan transformasinya, secara bertahap menghilangkan derau tersebut dalam beberapa langkah, menghasilkan video berkualitas tinggi yang menakjubkan.

Salah satu keunggulan utama dari Sora adalah kemampuannya untuk menghasilkan video secara menyeluruh atau memperluas video yang ada untuk membuatnya lebih panjang.

Dengan menerapkan model pandangan ke depan pada banyak bingkai sekaligus, Sora berhasil memecahkan tantangan kompleks dalam menjaga konsistensi subjek video meskipun dalam beberapa saat subjeknya mungkin tidak terlihat.

Mirip dengan model GPT yang terkenal, Sora juga menggunakan arsitektur transformator yang canggih. Hal ini menghasilkan performa penskalaan yang superior, memungkinkan Sora untuk menghasilkan video dengan kualitas yang sangat tinggi.

Sebagai bagian dari pendekatan inovatifnya, Sora merepresentasikan video dan gambar sebagai kumpulan unit data yang lebih kecil yang disebut patch dan serupa dengan yang digunakan dalam model GPT.

Dengan memadukan cara merepresentasikan data ini, Sora dapat melatih transformator difusi pada data visual dengan berbagai durasi, resolusi, dan rasio aspek, membuka kemungkinan baru dalam pembuatan konten visual.

Sora juga mengembangkan penelitian sebelumnya dalam model DALL-E dan GPT, memanfaatkan teknik recaptioning dari DALL-E 3. Teknik ini melibatkan pembuatan teks yang sangat deskriptif untuk data pelatihan visual.

Dengan pendekatan ini, model Sora dapat dengan setia mengikuti instruksi teks pengguna dalam menghasilkan video yang sesuai dengan keinginan.

Selain kemampuannya untuk menghasilkan video dari instruksi teks, Sora juga mampu mengambil gambar diam yang ada dan menghasilkan video darinya. Proses ini melibatkan animasi konten gambar dengan akurat dan memperhatikan detail kecil, menciptakan hasil yang menakjubkan.

Model ini juga dapat mengambil video yang ada dan memperluasnya atau mengisi frame yang hilang, memberikan fleksibilitas yang luar biasa dalam pembuatan konten visual.

Tags : #visual #sora #proses #pengembangan model #openai #model ai #membuat video #kemampuan #gpt #deskripsi teks #dall-e #agi

Kategori :

Begini Kemampuan Sora AI Mengubah Dunia Visual

Terkait

Kecerdasan Buatan Dituding Bikin Manusia Makin Tidak Cerdas: Pekerjaan Kian Ringan, Otak Ikut Kosong

OpenAI Luncurkan GPT-Live-1, Bikin Percakapan Suara ChatGPT Lebih Natural dan Responsif

Ketika Demam AI Memakan Rumah Sendiri: Terancam AI, Karyawan Gelisah

OpenAI Siapkan Revolusi ChatGPT, Bakal Jadi Superapp AI dengan Agen Pintar

OpenAI Luncurkan Lockdown Mode di ChatGPT, Fitur Baru Cegah Kebocoran Data

Terpopuler

Susunan Pemain Persebaya vs PSIS di Anniversary Game: Alex Martins, Yuran, Miguel Starter!

Spanyol vs Argentina 1-0: La Furia Roja Juara Dunia, Ferran Torres Jadi Hero!

Bukan Lamine Yamal, Pau Cubarsi Jadi Pemain Muda Terbaik Piala Dunia 2026

Laga Pramusim Berakhir Imbang, Juventus Didesak Datangkan Striker Baru

Profil Bang Faiq, Penjual Kambing Asal Batu Viral karena Mirip Isa Al Masih, Followers Tembus 87 Ribu dalam 2

Terkini

Konflik Timur Tengah Kian Sulit Dibendung: Dua Serdadu Tewas, AS Balas Iran

Hotman Paris Klarifikasi Ucapan 'Punya Otak Nggak Sih?', Minta Maaf kepada Wartawan

The Rolling Stones Samai Rekor The Beatles dengan 15 Album Nomor Satu di Inggris

Ratusan Warga Binaan 'Kelas Berat' Asal Jatim dan Sulsel Dipindah ke Nusakambangan

F1 GP Belgia 2026: George Russell DNF Bukan karena Hamilton, Ini Biang Keladinya!