Google AI Menghasilkan Kode yang Mengungguli Pemrogram Manusia
Pada bulan Mei 2017, Tim Otak Google mengumumkan pendekatan baru yang disebut AutoML. Ini adalah jaringan saraf pengontrol untuk mengembangkan arsitektur model anak, yang dapat dilatih untuk melakukan tugas tertentu. Sederhananya, ini adalah AI yang mampu menghasilkan AI sendiri.
Kumpulan Data yang Digunakan
Peneliti Google menguji AutoML pada kumpulan data akademis kecil seperti Penn Treebank dan CIFAR-10. Kemudian, mereka memutuskan untuk memberikan AutoML tantangan terberatnya hingga saat ini. Kali ini, mereka menguji kumpulan data yang lebih besar seperti deteksi objek COCO dan klasifikasi gambar ImageNet, dan hasilnya sangat mencengangkan.
Beberapa arsitektur machine learning yang canggih telah dikembangkan oleh manusia untuk mengerjakan kumpulan data yang lebih besar dalam kompetisi akademis. Dalam Mempelajari Arsitektur yang Dapat Dipindahtangankan untuk Pengenalan Gambar yang Dapat Diskalakan, peneliti Google menerapkan AutoML ke dua set data akademis paling populer – COCO dan ImageNet. Jika Anda menerapkan AutoML pada kumpulan data besar ini, dibutuhkan pelatihan selama beberapa bulan agar bisa mendapatkan hasil yang diinginkan.
Bagaimana Cara Kerjanya?
AutoML dibuat berdasarkan algoritme pembelajaran penguatan dan algoritme evolusi. Namun, untuk menerapkannya pada ImageNet, Peneliti memodifikasinya agar lebih mudah diterapkan pada kumpulan data skala besar –
- Mendesain ulang ruang pencarian agar menemukan lapisan terbaik, yang dapat ditumpuk secara fleksibel beberapa kali untuk membangun jaringan akhir
- Penelusuran arsitektur dilakukan pada CIFAR-10 dan arsitektur terbaik yang dipelajari ditransmisikan ke deteksi objek COCO dan arsitektur gambar ImageNet.
Setelah perubahan ini, AutoML dapat menemukan lapisan terbaik tidak hanya untuk CIFAR-10, tetapi juga untuk deteksi objek COCO dan klasifikasi ImageNet. Kedua lapisan ini digabungkan untuk membangun arsitektur baru, yang disebut NASNet .
Seperti yang ditunjukkan pada gambar, arsitektur NASNet (dikembangkan oleh AutoML) berisi 2 jenis lapisan – Lapisan normal dan lapisan Reduksi
Sumber:Blog Riset Google
Hasil
NASNet mencapai akurasi prediksi sebesar 82,7% pada klasifikasi gambar ImageNet, yang jauh lebih baik dibandingkan model awal sebelumnya yang dibuat oleh tim Google Brain. Selain itu, performanya 1,2% lebih baik dibandingkan hasil yang dipublikasikan dan tidak dipublikasikan sebelumnya.
NASNet juga dapat diubah ukurannya untuk menghasilkan serangkaian model yang mencapai tingkat akurasi yang layak dengan tetap mempertahankan biaya komputasi yang rendah. Misalnya, NASNet versi kecil menghasilkan akurasi sebesar 74% (sekaligus mengurangi biaya komputasi hingga setengahnya), yang lebih dari 3% lebih baik dibandingkan beberapa model canggih dengan ukuran yang sama, yang dirancang untuk platform seluler.
Seperti yang Anda lihat pada gambar, akurasi NASNet lebih tinggi daripada model buatan manusia pada berbagai ukuran model, yang melibatkan jumlah operasi dan parameter berbeda (dalam jutaan), untuk klasifikasi gambar ImageNet.
Tabel ini menunjukkan kinerja pencarian arsitektur dan model lain yang dikembangkan manusia pada klasifikasi ImageNet. Multi-Tambah mengacu pada jumlah operasi akumulasi perkalian gabungan untuk satu gambar.
Deteksi objek menggunakan Faster-RCNN dengan NASNet
Peneliti Google mentransfer fitur yang dipelajari dari ImageNet ke deteksi objek COCO. Dalam pengujian tersebut, pengintegrasian fitur ImageNet yang dipelajari dengan framework RCNN Lebih Cepat menutupi performa prediktif COCO sebelumnya. Model terbesar mencapai 43,1% mAP, yaitu sekitar 4% lebih baik dibandingkan hasil model canggih sebelumnya.
Referensi: arxiv.org
Kode sumber NASNet untuk inferensi klasifikasi gambar dan deteksi objek tersedia di Github.
Apa Selanjutnya?
Fitur yang dipelajari oleh NASNet di COCO dan ImageNet dapat digunakan kembali untuk beberapa aplikasi vision. Selain itu, pendekatan ini dapat mengajarkan kita sesuatu tentang mengapa jenis jaringan saraf tertentu memiliki kinerja yang sangat baik.
AutoML dapat membuka bidang pembelajaran mesin bagi non-ahli, dan dapat digunakan untuk mengembangkan mesin/robot canggih yang didukung AI. Menurut sebuah penelitian, AI pada tingkat kecerdasan ini dapat membantu penyandang tunanetra mendapatkan kembali penglihatannya.
Tentunya arsitektur ini dapat digunakan pada mobil self-driving. Anda juga dapat membayangkan sistem yang membantu mengidentifikasi lalu lintas, bahaya di jalan raya, dan pejalan kaki. Ini juga dapat digunakan dalam Augmented Reality untuk membuat aplikasi berinteraksi lebih baik dengan lingkungan. Namun mungkin penerapan paling menarik dari AI ini masih belum ditemukan.
Baca:15 Proyek Kecerdasan Buatan Tingkat Lanjut
Di masa depan, tim peneliti Google akan melakukan analisis dan pengujian jenis arsitektur yang dihasilkan komputer untuk menyempurnakan dan memahaminya dengan lebih baik. Jika berhasil, mereka dapat menginspirasi jaringan saraf jenis baru, yang akan memberikan dampak lebih besar bagi semua orang.