Saya baru-baru ini menghadiri MWC Shanghai. Robot itu besar – sangat besar. Saya melihat lusinan perusahaan, mencari pelanggan untuk diberi merek dan menawarkannya di salah satu dari banyak aplikasi. Ambil hanya satu contoh aplikasi – Tug, perawat robot. Ini tidak terlihat seperti gambar robot sci-fi kami, kecuali jika Anda memikirkan beberapa contoh yang lebih bermanfaat di Star Wars. Ini adalah kotak di atas roda, tetapi memiliki banyak fitur yang kami harapkan di robot seluler, termasuk navigasi dan penghindaran rintangan. Itu dapat menavigasi di sekitar rumah sakit, itu akan berhenti jika seseorang melangkah di depannya dan itu akan mengarahkan sekitar stand IV yang salah; itu juga dapat memanggil lift untuk sampai ke lantai lain.
Tujuan dari Tug adalah untuk memberikan obat-obatan dan makanan kepada pasien dan sudah dikerahkan di 37 rumah sakit VA di AS. Bayangkan beban kerja yang lepas dari bahu para pembuat permen yang sibuk. Ada beberapa aplikasi asisten lainnya, dalam perawatan lansia, dalam dukungan pengajaran, restoran dan hotel. Anggap ini sebagai hal besar berikutnya dalam asisten pribadi setelah speaker pintar (Amazon sudah memiliki 100k+ robot yang bekerja di gudang mereka, jadi jelas mereka sedang mengerjakan robot rumahan sebagai sekuel Echo). Ini bukan fiksi ilmiah; robot asisten rumah akan dikirim hari ini.
Ada tantangan teknis yang jelas dalam memproduksi robot semacam ini, tidak berbeda dengan masalah mengemudi otonom, meskipun ada beberapa perbedaan yang jelas. Navigasi dan penghindaran rintangan adalah hal biasa, tetapi konsep jalur mengemudi yang jelas dan manajemen lalu lintas tidak berlaku untuk robot ini; ini semua tentang penghindaran rintangan dan navigasi di dalam gedung (dengan pemetaan ulang untuk menyiasati rintangan tak bergerak sementara). Dan sementara antarmuka bahasa alami mungkin bagus untuk dimiliki di dalam mobil, untuk asisten robot mungkin penting. Siapa yang mau belajar menekan tombol ketika apotek mengirim obat yang salah, atau restoran mengacaukan pesanan Anda?
Gartner baru-baru ini membuat daftar 10 besar persyaratan AI dan penginderaan untuk robot, di antaranya:
Penglihatan komputer – analisis pemandangan, pengenalan objek, dll.
Pengenalan dan otentikasi biometrik – siapa yang berbicara dengan saya dan apakah mereka diizinkan untuk memberikan perintah tersebut
Antarmuka percakapan – pengenalan ucapan dan pemrosesan bahasa alami
analisis pemandangan akustik – mengenali suara khas seperti gonggongan anjing atau pecahan kaca
Penginderaan lokasi – di mana saya dan apa/siapa di dekat saya
Gerakan otonom – kemampuan untuk berpindah ke target di tempat lain dalam gedung tanpa bertabrakan dengan objek atau orang
Fungsi AI di robot – tidak hanya bergantung pada cloud
Pendekatan default untuk membangun sistem saat ini dengan kemampuan ini dimulai dengan membangun sistem AI ke dalam robot berdasarkan platform GPU multicore. Hal ini dapat dimengerti – pembuat produk dapat membuat prototipe solusi menggunakan platform siap pakai tanpa perlu khawatir tentang detail ASIC, dengan cara yang hampir sama mereka menggunakan papan pengembangan CPU untuk aplikasi yang lebih tradisional. Tetapi ketika volume produk meningkat atau Anda mendorongnya untuk meningkat, biaya dan kepuasan/diferensiasi pelanggan menjadi semakin penting. Solusi siap pakai itu mahal, haus kekuasaan, dan sulit dibedakan saat Anda menggunakan platform yang sama dengan orang lain. Itulah sebabnya solusi volume tinggi yang tak terhindarkan beralih ke platform ASIC. Anda tidak perlu meninggalkan semua investasi yang Anda masukkan ke dalam prototipe Anda; platform GPU berbiaya lebih rendah mungkin tetap menjadi bagian dari solusi, tetapi tingkat fungsionalitas AI yang signifikan dapat diturunkan ke platform yang jauh lebih hemat biaya dan lebih terintegrasi.
Keunggulan kinerja per watt DSP dibandingkan GPU dalam aplikasi pembelajaran mesin (ML) sudah dikenal luas, sebagian diturunkan karena operasi titik tetap di atas titik mengambang dan untuk fleksibilitas dalam kuantisasi di beberapa platform. Dan keuntungan harga (dalam volume) dari solusi kustom sudah dikenal. Inilah sebabnya mengapa Anda lebih cenderung melihat DSP tersemat dalam aplikasi ML yang peka terhadap volume/harga di edge daripada GPU yang siap pakai.
Tapi bisakah Anda melakukan semua yang bisa Anda lakukan di GPU? Ternyata cukup banyak yang bisa Anda lakukan. Ambil visi komputer - pemosisian, pelacakan, pengenalan objek, dan pengenalan gerakan misalnya. Tingkat pemrosesan penglihatan ini sudah tersedia saat ini di beberapa platform berbasis DSP yang disematkan. Atau ambil gerakan otonom yang mendukung pelatihan ulang lokal (tanpa harus pergi ke cloud). Sekali lagi, kemampuan pengenalan inti untuk mendukung kecerdasan ini, kemampuan yang sama yang juga Anda temukan di GPU, tersedia di DSP.
Pengenalan/otentikasi suara dan analisis adegan akustik juga dapat diturunkan. Ini (bersama dengan contoh lain di sini) dengan rapi menyoroti mengapa pembongkaran sangat masuk akal. Masing-masing operasi cerdas ini dipecah menjadi beberapa langkah, katakanlah dari pengambilan suara dan resolusi arah hingga mungkin pengenalan kata dasar dan akhirnya bahkan pemrosesan bahasa alami (NLP). Langkah terakhir adalah menantang dan mungkin memerlukan pergi ke awan. Tetapi langkah-langkah sebelumnya dapat ditangani dengan sangat nyaman dalam solusi yang disematkan. Beberapa aplikasi, di mana hanya kosa kata terbatas yang perlu dikenali atau di mana Anda ingin mendeteksi isyarat non-verbal seperti jendela pecah, Anda mungkin tidak memerlukan cloud (atau GPU lokal) sama sekali. Sudah ada petunjuk bahwa bahkan NLP terbatas dapat didukung di edge dalam waktu dekat.
Berbagai solusi telah muncul untuk mendukung fungsi front-end ini menggunakan AI di edge, dalam pemrosesan suara front-end dan dalam pembelajaran mendalam di IoT. Dengan menggunakan solusi ini, pengembang dapat dengan lebih mudah mengatasi tantangan yang muncul untuk membuat asisten pribadi robot ada di mana-mana.
Moshe Sheier adalah Direktur Pemasaran Strategis, CEVA, di mana dia mengawasi pengembangan perusahaan dan kemitraan strategis untuk target pasar inti CEVA dan area pertumbuhan di masa depan. Moshe terlibat dengan perusahaan SW dan IP terkemuka untuk menghadirkan solusi berbasis DSP yang inovatif ke pasar. Di waktu luangnya, Moshe mengendarai sepeda gunung dan berlatih Aikido.