NVIDIA Bersekutu Dengan VMware untuk Mengubah Ekonomi AI
Dengan meningkatkan tingkat pemanfaatan GPU, biaya pembuatan dan penerapan aplikasi AI akan berkurang secara substansial.
Pada konferensi VMworld 2019 hari ini, NVIDIA dan VMware mengumumkan bahwa mereka bersama-sama akan memungkinkan untuk sekarang menerapkan mesin virtual VMware pada unit prosesor grafis (GPU).
Sebagai bagian dari inisiatif ini, NVIDIA mengumumkan bahwa perangkat lunak GPU virtual (vGPU) sekarang dapat digunakan pada mesin virtual di server selain dukungan yang ada untuk sistem klien. Perangkat lunak NVIDIA Virtual Compute Server (vComputeServer) untuk GPU juga diperluas untuk menambahkan dukungan bagi platform VMware vSphere. NVIDIA juga berkomitmen untuk membuat hubnya untuk mengakses alat untuk membangun aplikasi kecerdasan buatan (AI) yang tersedia di platform VMware.
Lihat juga: Apa saja 3 Komponen Utama Kesiapan Kecerdasan Buatan?
Dengan menggunakan teknologi NVIDIA ini, VMware berjanji untuk menyediakan layanan cloud yang terdiri dari instans bare metal Amazon EC2 yang dipercepat oleh GPU NVIDIA T4 yang menjalankan perangkat lunak vComputeServer di VMware Cloud di AWS.
Secara kolektif, kemajuan ini tidak hanya memiliki implikasi signifikan untuk meningkatkan pemanfaatan GPU, tetapi juga memungkinkan ilmuwan data untuk menggabungkan beberapa beban kerja pada GPU yang berjalan di server VMware yang berada di lokasi atau di cloud, kata John Fanelli, wakil presiden produk untuk NVIDIAGrid.
Sementara minat untuk menggunakan GPU untuk membangun aplikasi kecerdasan buatan (AI) sangat besar, biaya untuk membangun aplikasi tersebut seringkali menjadi penghalang. Dengan tidak adanya mesin virtual, setiap GPU sebelumnya telah didedikasikan untuk menjalankan satu beban kerja pada satu waktu. Dengan meningkatkan tingkat pemanfaatan GPU, biaya pembuatan dan penerapan aplikasi AI akan berkurang secara substansial, kata Fanelli.
Hal ini penting karena biaya tersebut telah menghambat organisasi untuk berinvestasi lebih banyak dalam aplikasi AI yang berpotensi mengubah hampir semua aspek keberadaan manusia.
“AI adalah teknologi paling canggih di zaman kita,” kata Fanelli.
Namun, kinerja beban kerja AI yang berjalan di mesin virtual akan bervariasi tergantung pada atribut masing-masing, kata Fanelli. Banyak pengembang akan dapat mengkompensasi masalah kinerja apa pun dengan memanfaatkan toolkit NVIDIA CUDA untuk menjalankan beban kerja AI secara paralel, kata Fanelli.
Karena semakin terjangkau untuk membangun dan menerapkan aplikasi AI secara efisien, jumlah proyek AI yang akan diluncurkan dalam beberapa bulan ke depan akan meningkat. Untuk mempercepat proses itu, VMware juga mengatakan pelanggan akan dapat memigrasikan beban kerja dari instance GPU yang berjalan di pusat data lokal ke cloud menggunakan alat VMware HCX yang mengotomatiskan pergerakan mesin virtual dan mempercepat transfer data antar platform.
GPU yang diakses terutama di cloud telah menjadi platform pilihan untuk melatih model AI karena seberapa efisien GPU mengelola memori dan I/Ooverhead. NVIDIA, bagaimanapun, telah membuat kasus dengan keberhasilan yang beragam untuk juga mengandalkan GPU untuk menjalankan mesin inferensi yang perlu menjalankan model AI tersebut di tempat server x86. Dengan menambahkan dukungan untuk mesin virtual server ke perangkat lunaknya, akan menjadi jauh lebih layak untuk menjalankan beberapa mesin inferensi pada platform GPU yang sama dengan cara yang sama seperti mesin inferensi dikerahkan pada platform x86.
Tentu saja, memiliki akses ke sumber daya infrastruktur tambahan tidak selalu menjamin kesuksesan AI. Namun, sumber daya tersebut akan sangat membantu mengurangi biaya kesalahan selama proses pengembangan AI.