Pemrosesan data suara yang lebih cerdas menghasilkan masa pakai baterai yang lebih baik
Perangkat yang selalu mendengarkan telah mempermudah Anda untuk memutar musik, menyalakan TV pintar, mematikan termostat, dan bahkan mengingatkan kita ketika seseorang mendobrak masuk ke dalam rumah. Tetapi mereka meminta kami mencolokkannya ke daya AC atau mengganti baterai terlalu sering.
Meskipun kadang-kadang terasa seperti asisten suara telah ada dalam hidup kita selama beberapa dekade, baru pada akhir 2014 Amazon meluncurkan speaker pintar pertama, Amazon Echo. Lima tahun kemudian, kami sekarang memiliki ratusan juta asisten suara digital yang terpasang di speaker pintar, sistem rumah pintar, perangkat yang dapat dikenakan, dan perangkat pintar lainnya yang selalu mendengarkan kata bangun. Dari penelitian terbarunya, SAR Insight &Consulting memperkirakan bahwa pada tahun 2023, basis yang diinstal dari perangkat berkemampuan suara yang selalu aktif akan melonjak menjadi hampir 1 miliar.
Sensor yang pertama kali memungkinkan selalu mendengarkan dan mengutamakan suara — mikrofon sistem mikroelektromekanis ultra-miniatur (MEMS) seukuran titik pensil — menangkap data suara lingkungan. Pada awalnya, sepertinya solusi yang bagus untuk memproses data itu di cloud, menganalisis suara untuk kata dan perintah bangun. Namun pertumbuhan eksponensial dalam asisten suara dan perangkat IoT yang selalu aktif lainnya menghasilkan begitu banyak data — 41,6 miliar perangkat IoT menghasilkan 79,4 zettabytes data pada tahun 2025, menurut International Data Corp.
1
— bahwa kami membebani bandwidth kolektif dan menciptakan inefisiensi biaya dan daya sebagai konsekuensi yang tidak diinginkan. Hal ini mendorong industri semikonduktor untuk menemukan cara baru untuk menghadirkan beberapa komputasi awan yang kuat ke dalam perangkat — kemampuan yang disebut pemrosesan tepi.
Tantangan di ujung tanduk
Keberhasilan komputasi tepi sangat bergantung pada proliferasi cepat prosesor sinyal digital dan mikrokontroler berdaya rendah—beberapa di antaranya mencakup jaringan saraf tertanam, yaitu chip pembelajaran mesin kecil (TinyML). Sebagian besar chip pemrosesan digital ini dapat menangani analisis data yang kompleks, seperti memutuskan apakah kata bangun telah diucapkan, langsung di perangkat. Tapi sementara chip ini sekarang mungkin secerdas otak, mereka masih mengandalkan arsitektur sistem asli yang digunakan pada perangkat penginderaan pertama yang selalu aktif, yang memerlukan konversi langsung semua suara — yang secara alami analog — ke sinyal digital. Itu benar bahkan ketika suara, seperti gonggongan anjing atau tangisan bayi, tidak mungkin mengandung kata bangun. Membuang-buang daya dan data, pendekatan lama yang selalu mendengarkan ini menempatkan OEM pada jalur yang bertabrakan dengan ketidakpuasan konsumen.
Konsumen masih mengharapkan kinerja yang sama atau lebih baik dari perangkat pintar yang selalu lebih kecil dan selalu mendengarkan yang dapat dimasukkan ke dalam saku atau bahkan di dalam telinga, tetapi tanpa mengorbankan masa pakai baterai. Itu menempatkan OEM di tempat yang sulit karena jika mereka tetap menggunakan arsitektur lama, mereka akan terus menghabiskan 80% hingga 90% masa pakai baterai untuk memproses data yang tidak berarti. Mereka akan dipaksa untuk membuat konsumen memilih yang lebih ringan dari dua hal buruk:asisten suara non-portabel yang harus dicolokkan ke dinding atau asisten suara portabel yang dapat dibawa ke mana saja tetapi terhambat oleh masa pakai baterai yang singkat.
Karena memindahkan data melalui sistem memerlukan daya, cara paling efisien untuk menghemat daya adalah dengan mengurangi jumlah data hingga yang penting sesegera mungkin. Jika kita benar-benar ingin memecahkan tantangan kekuatan yang selalu mendengarkan, kita membutuhkan paradigma baru yang lebih meniru kemampuan otak untuk secara efisien memproses sejumlah besar data yang berasal dari sistem sensorik manusia pada saat tertentu. Habiskan sedikit daya di awal untuk menentukan apa yang relevan, dan hemat sebagian besar sumber daya untuk memproses hanya data yang paling penting.
Suara secara alami analog
Meningkatkan masa pakai baterai di perangkat yang selalu mendengarkan memerlukan penerapan teknologi yang menurut banyak insinyur saat ini kuno dan menakutkan:analog . Bekerja dengan sinyal analog mentah dan tidak terstruktur dari kata aslinya – yaitu, sentuhan, penglihatan, pendengaran, dan getaran – sangatlah sulit. Sejak pengenalan sirkuit terpadu digital pertama, jauh lebih mudah untuk membuat produk yang memproses sinyal sensor, dengan yang sudah dikenal atau nol, daripada langsung memproses data analog yang dirasakan. (Itulah sebabnya perangkat yang selalu aktif mengubah input analog menjadi sinyal digital dengan segera, sebelum melakukan hampir semua hal lainnya.)
Sementara digital telah secara efektif memecahkan tantangan pemrosesan selama 50 tahun terakhir, itu mungkin akhirnya menabrak tembok dalam hukum fisika. Perlambatan dalam penskalaan perangkat digital telah menyebabkan para teknolog berkreasi dengan chip di dalam perangkat. Dalam hal ini, kreativitas tersebut telah melalui dua perubahan mendasar:Penggunaan digital secara lebih strategis, sehingga chip digital melakukan pemrosesan berat hanya jika diperlukan; dan menggunakan daya rendah yang melekat pada sirkuit analog, dikombinasikan dengan pembelajaran mesin, untuk melakukan analisis putaran pertama yang menentukan apakah suara ada saat data suara masih dalam keadaan analog alami. Itu membuat chip pemrosesan digital dalam mode tidur berdaya rendah sampai mereka benar-benar diperlukan untuk "mendengarkan" kata kunci.
Jalan menuju efisiensi daya yang lebih besar pada perangkat yang selalu aktif tidak terletak pada memiliki setiap chip "berpikir seperti otak" tetapi dalam membayangkan kembali arsitektur sistem yang lebih seperti sistem sensorik manusia, secara progresif menganalisis suara berlapis-lapis sehingga sebagian besar energi difokuskan pada apa yang paling penting.
Pemrosesan tepi yang terinspirasi oleh bio (bawah) memfokuskan kekuatan pemrosesan digital pada data sensorik yang paling relevan. (Gambar:Aspinity)
Semua orang menang
Perburuan untuk masa pakai baterai yang lebih lama akan mendorong perancang sistem untuk merangkul paradigma arsitektur baru di mana lebih sedikit pemrosesan data berarti lebih banyak masa pakai baterai. Berada di tepi, chip ML analog dapat bertindak seperti pengelola lalu lintas cerdas yang memungkinkan chip pemrosesan digital tetap tertidur kecuali diperlukan. Pendekatan pemrosesan selalu-on edge yang terinspirasi oleh bio ini memungkinkan prosesor analog dan digital melakukan pekerjaan yang paling efisien, menjadikan konsumen sebagai pemenang utama. Lagi pula, siapa yang tidak menginginkan remote TV yang diaktifkan dengan suara yang beroperasi selama satu tahun dengan satu set baterai?
Referensi
1
International Data Corp. Worldwide Global DataSphere IoT Device and Data Forecast, 2019–2023. Juni 2019
>> Artikel ini awalnya diterbitkan pada situs saudara kami, EE Times Europe.