Manufaktur industri
Industri Internet of Things | bahan industri | Pemeliharaan dan Perbaikan Peralatan | Pemrograman industri |
home  MfgRobots >> Manufaktur industri >  >> Industrial Internet of Things >> Sensor

Pertimbangan desain untuk sistem perintah suara berdaya rendah yang selalu aktif

Asisten suara dan integrasi sedang diterapkan ke sebagian besar produk, peralatan, dan teknologi yang diperkenalkan ke pasar. Meskipun demikian, bukan rahasia lagi bahwa asisten suara yang berguna ini selalu mendengarkan kata-kata pengaktifan/pembangun (seperti "oke Google" atau "Alexa"), yang sering kali menggunakan daya dalam jumlah besar. Di dunia di mana teknologi berkembang pesat, sangat penting untuk mempertimbangkan dampaknya terhadap konsumsi energi.

Artikel ini memberikan pertimbangan desain untuk sistem perintah suara berdaya rendah yang selalu aktif menggunakan deteksi aktivitas suara (VAD). Ini mengeksplorasi pertukaran dan pertimbangan saat memilih komponen yang diperlukan untuk membuat antarmuka pengguna suara (VUI) yang mudah digunakan dan hemat energi.

Fungsi VAD mendeteksi suara manusia di lingkungan sebelum mendengarkan kata bangun, artinya saat tidak ada orang di rumah, asisten suara Anda tidak akan membuang energi yang tidak perlu. Diperkirakan ada 4,2 miliar asisten suara digital yang digunakan di seluruh dunia, dan jumlah ini diperkirakan akan berlipat ganda pada tahun 2024. Menerapkan teknologi ini ke dalam perangkat lunak asisten suara dan produk lain yang mengandalkan integrasi suara akan menurunkan konsumsi energi secara drastis. yang menggunakan asisten suara.

Ada beberapa arsitektur perangkat keras untuk mengimplementasikan sistem VUI. Secara umum, implementasi antarmuka pengguna suara biasa terdiri dari mikrofon, baik satu mikrofon atau rangkaian mikrofon yang terhubung ke prosesor audio untuk menangkap dan memproses suara.

Aliran audio yang masuk dapat diproses pada prosesor tepi audio tepi, mikrofon pintar dengan prosesor tepi audio internal, atau pada prosesor aplikasi standar (AP). Prosesor audio edge dioptimalkan untuk pemrosesan sinyal audio berdaya rendah dan latensi rendah. Selain menyediakan pemrosesan audio input khusus, prosesor audio edge juga dapat digunakan untuk sinyal output audio pasca-pemrosesan. Jika sistem VUI terhubung ke cloud, prosesor tepi audio juga dapat berkomunikasi dengan antarmuka VUI cloud melalui system-on-a-chip (SoC) utama dengan konektivitas nirkabel. Dua implementasi berbeda untuk sistem VUI disajikan dalam makalah ini bersama dengan pertukarannya masing-masing.

VAD berdaya sangat rendah (deteksi aktivitas suara)

Arsitektur yang ditunjukkan pada gambar 1 mendukung VUI berdaya sangat rendah menggunakan jalur sinyal analog, termasuk mikrofon analog dan komparator analog untuk menyediakan pemicu bangun. Ketika aktivitas akustik terdeteksi, rantai sinyal analog menghasilkan interupsi untuk membangunkan prosesor audio untuk pengambilan suara. Perangkat juga dapat menyertakan fitur “push-to-talk”, di mana pengguna menekan tombol untuk mengaktifkan prosesor audio.

Mikrofon bangun analog harus selalu mendengarkan lingkungan, dan oleh karena itu mikrofon ini, bersama dengan komparator, harus mengkonsumsi daya yang sangat kecil. Contoh prosesor audio yang efisien dengan konsumsi daya kurang dari 1mW dalam mode pemicu bangun paling sederhana, dan memori 1MB untuk pemrosesan audio tingkat lanjut adalah Knowles IA8201. Meskipun pendekatan yang diilustrasikan pada gambar 1 menyediakan pendekatan AAD (deteksi aktivitas akustik) berdaya rendah sederhana untuk VUI yang selalu aktif di perangkat seperti remote control dan perangkat yang dapat dikenakan, pendekatan ini memiliki keterbatasan. Implementasi ini membangunkan prosesor audio untuk sinyal akustik apa pun dan dapat menyebabkan konsumsi daya sistem secara keseluruhan tinggi dalam situasi bising. Selain itu, sistem antarmuka pengguna suara yang terhubung ke cloud memerlukan data audio untuk jangka waktu sesaat sebelum kata bangun ditangkap untuk meningkatkan akurasi deteksi kata bangun. Ini biasanya disebut sebagai pra-putar dan merupakan persyaratan yang harus dimiliki untuk perangkat berkemampuan Alexa dan perangkat speaker pintar lainnya.

Gambar 2 menunjukkan arsitektur yang mendukung buffering pra-putar untuk perangkat seperti speaker pintar. Perangkat ini biasanya memiliki baterai yang lebih besar dan/atau mungkin tidak memiliki persyaratan masa pakai baterai beberapa bulan dengan sekali pengisian daya. Sistem VUI selalu aktif, mendengarkan lingkungan dan merekam pra-putar dalam buffer melingkar. Panjang pra-putar biasanya sekitar 500 mdtk data audio dan digunakan untuk mengkalibrasi tingkat kebisingan sekitar.

Ada beberapa pendekatan berbeda untuk mendesain arsitektur front-end yang selalu aktif. Pilihan prosesor audio bergantung pada jumlah mikrofon yang digunakan, dan apakah mikrofon itu analog atau digital.

Arsitektur yang ditunjukkan di atas menggunakan Knowles IA611 untuk deteksi aktivitas suara, mikrofon digital SPH0655LM4H-1 Cornell II untuk beamforming, dan Knowles IA8201 untuk pemrosesan audio. Knowles IA611 adalah mikrofon pintar yang menawarkan manfaat bagi perancang sistem seperti yang dibahas di bagian berikut.

Pilihan mikrofon

Untuk arsitektur yang ditunjukkan pada gambar 1, mikrofon analog tunggal dan komparator digunakan sebagai input pemicu untuk membangunkan prosesor audio ketika aktivitas akustik terdeteksi. Mikrofon bangun harus berupa mikrofon analog berdaya rendah dengan rasio signal-to-noise (SNR) sebaiknya lebih tinggi dari 62 dB. Portofolio mikrofon Knowles SiSonic MEMS menawarkan beberapa pilihan untuk mikrofon bangun. Misalnya, mikrofon analog Kaskade SPV1840LR5H-B adalah pilihan yang baik yang hanya mengonsumsi 45µA saat ON. Jalur analog yang selalu aktif, termasuk mikrofon, amplifier, dan komparator, mengkonsumsi kurang dari 67µA. Ada mikrofon piezoelektrik yang tersedia di pasar dengan daya yang sangat rendah dan selalu aktif (10µA), tetapi biasanya memiliki SNR rendah, yang dapat memengaruhi kinerja sistem.

Untuk arsitektur yang mampu buffering pra-putar yang ditunjukkan pada gambar 2, mikrofon dengan prosesor audio tertanam dan memori yang cukup untuk terus menangkap data suara dalam buffer melingkar 2 detik, seperti Knowles IA611, adalah opsi yang layak untuk aktivitas suara yang selalu aktif deteksi. Itu juga dilengkapi dengan ekosistem pemicu dan perintah suara porting, seperti Alexa Amazon. Saat kata kunci terdeteksi, buffer pra-putar dan audio suara yang diucapkan dikirim ke mesin pengenalan suara otomatis (ASR) cloud. Daya bangun suara IA611 yang selalu aktif adalah 0,39 mA @ baterai 1,8V dan efisiensi 90 persen, menjadikannya pilihan yang baik untuk antarmuka pengguna suara di perangkat yang dioperasikan dengan baterai seperti speaker Bluetooth. Perangkat juga menerima input PDM dari mikrofon digital, dan dapat digunakan untuk mendukung beamforming pada prosesor BT-SoC host dengan melewatkan audio setelah sistem aktif.

Meskipun daya yang selalu aktif ini dapat diterima untuk aplikasi pra-putar, namun juga patut dipertimbangkan untuk arsitektur non-putar seperti yang diilustrasikan pada gambar 1. Seperti dijelaskan sebelumnya, mikrofon bangun analog akan memicu suara yang masuk dan menyalakan prosesor audio. Ini bisa menjadi masalah di lingkungan yang bising, seperti saat TV NYALA, di mana akan ada banyak bangun palsu yang menyebabkan pemborosan daya yang signifikan. Jika deteksi aktivitas suara digunakan sebagai pengganti mikrofon bangun analog berdaya rendah, sistem akan menyala hanya ketika kata kunci terdeteksi. Masuk akal untuk melihat mengapa menggunakan mikrofon pendeteksi aktivitas suara mungkin lebih efisien daripada mikrofon bangun analog sederhana di lingkungan yang bising.

Gambar 3 menunjukkan data simulasi yang membandingkan jumlah hari masa pakai baterai untuk remote control TV biasa yang menggunakan VAD pada IA611 vs. mikrofon AAD piezoelektrik berdaya rendah yang bersaing dan prosesor audio untuk berbagai durasi aktivitas akustik waktu ON. Aktivitas akustik dapat hadir ketika TV atau peralatan rumah tangga lainnya ON, atau dalam situasi lain ketika ada ocehan dll. Seperti yang terlihat pada gambar 3, ada titik crossover sekitar 3 jam, dimana keuntungan daya menggunakan AAD analog di mikrofon pesaing vs deteksi aktivitas suara di IA611 menghilang.

Pada lima jam waktu aktivitas akustik ON, solusi deteksi aktivitas suara menawarkan delapan hari masa pakai baterai ekstra dibandingkan solusi berbasis AAD yang bersaing. Untuk menempatkan keuntungan ini dalam konteks, orang dewasa AS menonton TV hampir delapan jam per hari, menurut sebuah studi Nielsen yang diterbitkan pada tahun 2017. Dengan meningkatnya permintaan untuk perangkat yang terhubung ke internet, seperti TV pintar, konsol game, dan perangkat multimedia lainnya, jam aktivitas akustik di rumah tangga khas AS kemungkinan akan terus meningkat juga. Menggunakan bangun berbasis VAD yang cerdas akan membantu perancang sistem mengembangkan sistem VUI yang lebih hemat daya.

Kesimpulan

Dari rumah pintar, keramahtamahan, tempat kerja digital, pembayaran suara, manajemen energi cerdas, voice at the edge dan perawatan kesehatan, hingga aplikasi IoT industri yang mengubah lantai pabrik, suara menambah fleksibilitas, efisiensi, keberlanjutan, dan penerimaan adopsi terhadap teknologi baru.

Berbagai arsitektur perangkat keras untuk desain antarmuka pengguna suara, bersama dengan bagian mikrofon, masing-masing melayani kebutuhan yang sedikit berbeda tergantung pada aplikasi perangkat akhir dan preferensi desainer; Misalnya, perangkat berkemampuan Alexa dan speaker pintar memerlukan arsitektur yang mendukung buffering pra-putar.

Insinyur dan desainer elektronik harus mengevaluasi dengan cermat bagaimana perangkat akhir akan memanfaatkan suara, kemampuan yang ingin mereka akses, dan dari sana, menentukan arsitektur dan komponen mikrofon yang tepat.


Raj Senguttuvan memiliki lebih dari 15 tahun pengalaman dalam pengembangan teknologi baru untuk aplikasi konsumen dan industri, pengembangan bisnis tahap awal, dan manajemen proyek untuk perusahaan termasuk Perangkat Analog dan Instrumen Texas. Dalam perannya sebagai direktur, pemasaran strategis untuk Knowles, ia mengarahkan pengembangan tingkat sistem, mendorong investasi ventura dan kemitraan, dan strategi pemasaran untuk IoT dan teknologi konsumen termasuk prosesor audio, algoritme, mikrofon, sensor, dan penerima. Raj meraih gelar MBA dari Cornell University dan PhD di bidang teknik listrik dari Georgia Institute of Technology.


Konten Terkait :

Untuk lebih banyak Tertanam, berlangganan buletin email mingguan Tertanam.

Sensor

  1. 6 Pertimbangan Desain Penting untuk Pencetakan 3D Logam
  2. Keuntungan Teknologi Tertanam untuk Desain Modular
  3. Pertimbangan Tata Letak PCB
  4. Desain Untuk Pembuatan PCB
  5. Pertimbangan Desain Iluminasi untuk Sistem Penglihatan Bedah Robot
  6. Mengapa Ketertelusuran adalah Landasan Penting untuk Sistem Manufaktur yang Diaktifkan IIoT
  7. Desain Terinspirasi Laba-laba Membuka Jalan untuk Fotodetektor yang Lebih Baik
  8. Pertimbangan Penting untuk Perakitan PCB
  9. Pertimbangan Desain Impedansi untuk PCB Flex-Rigid
  10. Pertimbangan Desain Antena dalam Desain IoT