Decart Meluncurkan Oasis3:Model Dunia Latensi Rendah yang Realistis untuk Pelatihan Robotika
Laboratorium penelitian AI Frontier, Decart, telah memperkenalkan Oasis3, model dunia yang dirancang untuk menjembatani kesenjangan antara simulasi sintetis dan penerapan AI di dunia nyata.
Mesin keluaran video, yang diluncurkan bulan ini, mempercepat pelatihan robot dan sistem kontrol kendaraan otonom, sehingga memperlengkapi mereka untuk berkembang di tengah kondisi dunia nyata yang tidak dapat diprediksi.
Pengembang robotika menghadapi kelangkaan data berkualitas tinggi yang diperlukan untuk melatih sistem yang dapat menavigasi lingkungan dunia nyata yang kompleks.
Meskipun kendaraan dapat belajar bermanuver di tempat parkir statis dengan kerucut lalu lintas tetap, jalan terbuka menghadirkan lingkungan yang jauh lebih sulit karena cuaca, pencahayaan, dan hambatan dinamis terus berubah.
Sistem pelatihan untuk menangani kekacauan jalanan perkotaan—hujan lebat, rintangan yang tiba-tiba, lalu lintas yang tidak menentu—mewakili tantangan tersendiri yang ditangani Oasis3.
Hambatan pelatihan robotika
Model bahasa besar (LLM) telah berkembang pesat, namun robotika untuk keperluan umum—atau AI fisik—masih tertinggal, sebagian besar disebabkan oleh kurangnya sumber daya media yang kaya.
Bessemer Ventures mencatat bahwa pengembang LLM mendapat manfaat dari menghapus miliaran halaman web publik, sebuah kemewahan yang tidak tersedia bagi model Vision‑Language‑Action (VLA) yang harus menafsirkan dan bertindak dalam ruang fisik.
Model VLA menyerap data lingkungan, memprosesnya, dan kemudian merespons. Melatih mereka menawarkan tiga jalur utama:
- Teleoperasi —Operator manusia meniru tindakan robot dalam pakaian yang terkendali. Meskipun menghasilkan data dengan kualitas terbaik, biayanya sangat mahal dan lambat, sehingga penerapan skala besar menjadi tidak praktis.
- Video web terbuka —tersedia tetapi berantakan, kurang memiliki lingkungan yang konsisten, telemetri spasial, dan pengondisian tindakan langsung.
- Data sintetis —sebuah jalan tengah, namun mesin fisika saat ini tidak memenuhi nuansa dunia nyata, sehingga menyebabkan apa yang disebut kesenjangan sim‑ke‑nyata .
Kesenjangan tersebut terwujud ketika keacakan di dunia nyata—tumpahan minyak, kemasan yang rapuh, puing-puing yang tidak terduga—membuat sistem otonom menjadi tidak seimbang dan menunjukkan keterbatasannya.
Menutup kesenjangan dengan simulasi generatif loop tertutup
Desart mengklaim Oasis3 menjembatani batasan pelatihan virtual yang ada dengan menggabungkan grafik gerak fotorealistik dengan mesin fisika yang tangguh.
Tersemat dalam satu loop pelatihan berperforma tinggi, Oasis3 menghasilkan aliran video yang dikondisikan dengan tindakan yang dapat menghasilkan hampir semua skenario kacau yang dibayangkan pengembang, menciptakan lingkungan pelatihan yang sangat mencerminkan kenyataan.
Platform ini mendukung lingkungan multiview dan ultra-realistis yang dapat dikontrol sepenuhnya; deviasi lateral mobil self-driving memicu aliran generatif yang menyesuaikan perspektif dalam waktu kurang dari 200 md—sesuai dengan persyaratan pembelajaran penguatan.
Dirancang bersama dengan ekosistem AI fisik Nvidia, Oasis3 berjalan pada infrastruktur cloud khusus CoreWeave pada 22fps, menghadirkan lingkungan virtual interaktif pada resolusi 512×768×3.
Ini menawarkan tampilan tiga kamera asli untuk menjaga konsistensi spasial dan temporal dari berbagai sudut, memungkinkan sistem otonom mengukur kedalaman dan konteks periferal secara akurat.
Oasis3 dapat diakses melalui API Desart, sehingga pengembang dapat mengintegrasikannya dengan lancar ke dalam pipeline simulasi AI fisik yang ada.
Melatih robot untuk menaklukkan wilayah yang belum dipetakan
Untuk mencapai humanoid tingkat fiksi ilmiah, robot harus dilatih untuk menangani kasus-kasus tepi yang unik secara real-time—situasi yang tidak mungkin ditiru di laboratorium, seperti beban jatuh ke jalan sementara kamera kendaraan otonom tertutup lumpur.
Oasis3 memberdayakan pengembang untuk membuat variasi tak terbatas dari peristiwa tersebut menggunakan perintah bahasa alami yang sederhana, mencakup berbagai sudut, kondisi cuaca, dan permukaan jalan.
Dengan memaparkan model pada jutaan bahaya secara terjangkau, developer dapat memastikan kesiapan menghadapi skenario dunia nyata apa pun yang masuk akal.
