Kemajuan dalam kecerdasan buatan sekarang memungkinkan akurasi yang cukup dalam biometrik suara yang dapat digunakan tidak hanya untuk identifikasi dan personalisasi, tetapi untuk aplikasi seperti otentikasi pembayaran. Solusi baru dari Synaptics dan ID R&D menawarkan biometrik suara bertenaga AI dan algoritme anti-spoofing yang dapat berjalan pada Synaptics SoC di perangkat edge. Secara khusus, perangkat lunak telah dioptimalkan untuk unit pemrosesan saraf (NPU) dalam seri VS600 Synaptics untuk perangkat rumah pintar seperti dekoder (STB), speaker pintar, dan sistem keamanan.
Synaptics menjual SoC berkemampuan AI-nya ke dalam produk rumah pintar yang perlu memproses streaming video, streaming audio, dan pencitraan. Kasus penggunaan tipikal mungkin adalah STB yang menggabungkan kamera untuk konferensi video, misalnya.
Biometrik suara sekarang cukup akurat untuk mengaktifkan autentikasi pembayaran di perangkat rumah pintar
“Apa yang umum di aplikasi set top box dan menjadi lebih umum seiring berjalannya waktu adalah kemampuan untuk menggunakan suara sebagai antarmuka,” Vineet Ganju, wakil presiden pemasaran di Synaptics mengatakan kepada EE Times . “Remote control dapat diaktifkan dengan suara sehingga Anda dapat berbicara dengannya untuk menavigasi akun Netflix dan mencari film… suara sebagai antarmuka hampir menjadi standar dalam aplikasi ini.”
Saat STB menjalankan Netflix, hal pertama yang harus dilakukan pengguna adalah memilih profil siapa yang akan digunakan. Dengan biometrik suara, STB akan segera mengetahui siapa yang menonton, memotong satu langkah dari proses.
“Misalnya, dengan konten bayar per tayang, Anda tidak hanya dapat menelusuri melalui suara dan menemukan film tertentu yang mungkin bukan bagian dari langganan Anda, tetapi Anda bersedia membayar $5 untuk menontonnya,” kata Ganju. “Kemudian [operator] ingin dapat segera mengautentikasi dan meminta Anda membeli film itu di tempat. Mereka melihatnya sebagai pengurangan gesekan yang besar, membantu pengguna tidak hanya dalam menemukan konten yang dipersonalisasi untuk mereka, tetapi juga mampu membayar konten tersebut dan dapat menontonnya.”
Pendaftaran di perangkat
Biometrik suara ID R&D AI mengekstrak lebih dari 400 fitur dari suara, termasuk kombinasi parameter yang terkait dengan frekuensi/nada dan hal-hal lain seperti pengucapan dan aksen.
“Ini tidak terbatas seperti beberapa generasi sebelumnya dari biometrik suara,” John Amein, wakil presiden senior penjualan di ID R&D mengatakan kepada EE Times , menambahkan bahwa hanya dalam setahun terakhir ini biometrik suara AI telah mencapai akurasi yang diperlukan untuk aplikasi seperti autentikasi pembayaran.
Algoritme belajar mengenali suara pengguna melalui proses yang disebut "pendaftaran" di mana pengguna mengulangi frasa tiga kali. Frasa apa pun dapat digunakan, dan itu berfungsi pada bahasa apa pun di luar kotak. Pendaftaran diproses di perangkat edge.
Algoritme AI ID R&D dapat mengidentifikasi pengguna yang terdaftar dengan tingkat penerimaan palsu di bawah 1 dalam 10.000, yang Amein bandingkan dengan kemungkinan seseorang menebak PIN Anda. Tingkat penolakan palsu — tingkat penolakan suara pengguna yang terdaftar secara keliru — mendekati 5%. Dan tingkat penerimaan spoof (SAR), untuk serangan spoofing seperti rekaman suara pengguna yang diputar ke sistem, lebih baik dari 7%, yang merupakan batas standar untuk membuka kunci biometrik perangkat Android.
“Antara pencocokan biometrik berada pada tingkat penerimaan palsu satu dalam 10.000 dan anti spoofing lebih baik daripada tingkat 7% yang dipersyaratkan oleh standar Android, kami benar-benar mencapai kedua hal yang diperlukan agar biometrik suara dapat diterima. cukup aman untuk otorisasi pembayaran,” kata Amein.
Anti-spoofing
Teknologi anti-spoofing ID R&D juga mengandalkan AI.
“Suara lisan memiliki bandwidth yang naik hingga 3500 Hz, dan kami mengambil sampel dengan kecepatan yang jauh lebih tinggi dari itu,” kata Amein. “Jadi kita mendengar frekuensi yang lebih tinggi daripada suara yang diucapkan. Kami mendengarkan dalam rentang yang lebih tinggi ini untuk karakteristik yang berbeda.”
Suara manusia yang diciptakan dengan berbicara melalui saluran vokal berbentuk tabung kita menghasilkan frekuensi karakteristik yang sangat berbeda dengan suara yang dihasilkan oleh getaran permukaan datar seperti pada pengeras suara. Ini adalah salah satu elemen yang digunakan AI anti-spoofing untuk membedakan suara langsung dari rekaman.
“Kami juga dapat mendeteksi suara yang disintesis, seperti aplikasi text to speech,” kata Amein. “Banyak dari itu tidak terlalu bagus, tetapi mereka semakin hidup. Dan dalam skenario itu, masih ada anomali dalam sinyal – terlalu sempurna dalam beberapa kasus, atau hanya akan ada transisi atau perbedaan fase yang tidak bisa didengar telinga, tetapi [AI] bisa.”
Unit pemrosesan saraf
SoC seri VS600 Synaptics menampilkan unit pemrosesan saraf (NPU); NPU VS680 menawarkan 6,75 TOPS sementara VS640 yang baru diumumkan menawarkan 1 TOPS dan ditujukan untuk "biaya dan kinerja dan titik daya yang lebih utama," kata Vineet Ganju dari Synaptics. NPU bagian mana pun memiliki komputasi "lebih dari cukup" untuk menjalankan algoritme biometrik suara ID R&D dan anti-spoofing secara bersamaan, katanya. NPU mampu mempercepat inferensi biometrik suara dengan faktor 10 dibandingkan dengan menggunakan CPU chip, yang pemanfaatannya dikurangi dengan faktor 3.
Synaptics menyediakan perangkat yang memungkinkan perusahaan seperti ID R&D untuk mengoptimalkan teknologi mereka untuk NPU, dan sementara ID R&D adalah mitra pertama Synaptics dalam hal ini, perusahaan akan bekerja dengan lebih banyak mitra di masa depan untuk aplikasi di luar biometrik suara.
“Berdasarkan diskusi kami dengan perusahaan pengenalan suara, kami benar-benar dapat melakukan mesin pengenalan suara kosakata bahasa Inggris penuh pada perangkat, baik dalam kemampuan 1 TOPS dari NPU,” kata Ganju. “Jadi Anda dapat memiliki produk sepenuhnya offline terkait pengenalan suara… misalnya, untuk produk yang pengguna tidak langsung menghubungkannya ke WiFi, pengenalan suara onboard dapat membantu mereka mendapatkan pengalaman yang baik bahkan sebelum itu terhubung.”
Pembuatan perangkat lunak pertama dari ID R&D akan tersedia di kit pengembangan VS600 Synaptics akhir bulan ini.
>> Artikel ini awalnya diterbitkan pada situs saudara kami, EE Times.