Mengapa keunggulan yang lebih cerdas akan memicu aplikasi visi komputer baru pada tahun 2019
2018 telah melihat kemajuan besar dalam kemampuan visi komputer. Keakuratan deteksi objek dan pengenalan wajah terus meningkat, dan jumlah opsi yang tersedia berdasarkan teknologi pembelajaran mendalam yang canggih termasuk jaringan saraf convolutional dan berulang terus meningkat. Perbaikan datang dengan biaya – peningkatan kompleksitas dan persyaratan pemrosesan teknologi. YOLOV3 misalnya, model pengenalan objek yang populer, memiliki 106 lapisan arsitektur yang mendasari konvolusi penuh, lebih dari dua kali lipat dari versi sebelumnya. Model lain, seperti varian RetinaNet dan SSD juga menunjukkan kemajuan besar dalam akurasi, tetapi sekali lagi dengan mengorbankan peningkatan kompleksitas dan penurunan kinerja.
Mengikuti Tuntutan Baru
Sementara kompleksitas dan persyaratan komputasi dari teknologi visi komputer tingkat lanjut meningkat, ada permintaan untuk menerapkan teknologi ini terhadap peningkatan jumlah streaming video langsung resolusi tinggi. Jumlah kamera pengintai video meningkat pada tingkat yang dramatis, bersama dengan harapan bahwa mereka memberikan intelijen proaktif. Sistem video pasif tidak lagi cukup. Kamera, cukup sederhana, harus jauh lebih pintar.
Realitas peluncuran teknologi pembelajaran mesin canggih membutuhkan cara berpikir baru tentang implementasi. Streaming video resolusi penuh ke cloud untuk diproses sangat mahal, membutuhkan terlalu banyak bandwidth, dan menimbulkan latensi tinggi. Menempatkan sejumlah besar server bertenaga tinggi di tempat memiliki serangkaian masalah sendiri, membutuhkan ruang dan daya yang berharga dalam jumlah besar, dan dapat menjadi penghalang biaya ketika mencoba meluncurkan di sejumlah besar kamera. Ini juga tidak membahas realitas berurusan dengan lingkungan multi-lokasi yang menjadi semakin penting untuk memanfaatkan data. Memproses video langsung dari 1 atau 2 kamera adalah satu hal. Memproses video dari ratusan kamera secara real-time di satu atau beberapa lokasi, seringkali dengan sumber daya yang terbatas, mengharuskan kita untuk berpikir secara berbeda.
Solusinya:Video di Tepi
Jawabannya ada di tepi. Menempatkan kecerdasan di ujung tombak memungkinkan beban kerja didistribusikan ke banyak perangkat. Ini bisa berarti menanamkan kemampuan pemrosesan yang lebih kuat ke dalam kamera itu sendiri atau menambahkan peralatan tepi yang sangat efisien yang berada di antara kamera dan cloud. Untuk mengaktifkan ini, perusahaan pemrosesan tepi mulai merilis prosesor AI khusus yang cepat dan hemat daya. Nvidia telah meluncurkan beberapa modul dalam seri Jetson mereka untuk melakukan inferensi waktu nyata di perangkat yang disematkan dan Intel, melalui akuisisi Movidius, menawarkan prosesor seri Myriad dan stik komputasi saraf. Beberapa tahun terakhir juga terlihat sejumlah besar dana investor mengalir ke generasi baru perusahaan chip yang menawarkan kemampuan pemrosesan pembelajaran mendalam berbiaya rendah dan berkinerja tinggi. Perusahaan seperti Mythic, Graphcore, dan lainnya telah menerima dana ventura 100 juta dolar. Baru-baru ini bahkan Google dan Amazon mengumumkan chip pemrosesan tepi mereka sendiri. Ini adalah pengakuan luar biasa oleh dua perusahaan cloud play murni tentang pentingnya pemrosesan pembelajaran mesin di edge.
Apa yang Akan Datang
Pemrosesan berbasis tepi akan memungkinkan jenis kecerdasan real-time yang sama sekali baru. Apa yang saat ini menjadi perekam video pasif akan segera ditonton untuk anak-anak yang berisiko tenggelam di kolam renang, mendeteksi senjata di dekat sekolah atau membuka pintu untuk karyawan tanpa kunci. Mereka akan mencari cacat di lini manufaktur, menemukan pekerja yang tidak mengenakan peralatan keselamatan, dan mempelajari bagaimana orang bergerak di lingkungan ritel untuk mengoptimalkan arus dan mengurangi waktu tunggu. Kamera akhirnya akan memberikan data yang dapat ditindaklanjuti secara real-time. Kami akan melihat peningkatan besar dalam kemampuan kami untuk meningkatkan keamanan, keandalan manufaktur, kepuasan dan keselamatan pembeli di dalam toko.
Dengan lebih dari 1 miliar kamera dalam penerapan dan miliaran berikutnya siap digunakan, pemrosesan tepi menawarkan potensi untuk menjadikannya pintar.
Sudah, perusahaan dapat menemukan penyedia layanan intelijen video seperti Kogniz mampu memberikan kemampuan yang dapat mengidentifikasi orang dan pola secara real time. Dengan pendekatan Kogniz, layanan ini memanfaatkan peralatan berbasis edge termasuk kamera mandiri dan adaptor untuk kamera IP yang ada, memungkinkan penerapan sesuai permintaan dengan infrastruktur minimal. Solusi Kogniz bekerja dengan jumlah kamera yang tidak terbatas dan di berbagai lokasi.
Jed Putterman menjabat sebagai Co-CEO Kogniz. Mr Putterman telah memulai beberapa perusahaan teknologi termasuk Snapcentric, diakuisisi oleh VeriSign, dan Allerez, diakuisisi oleh Mercury Interactive Corporation. Bapak Putterman memulai karirnya di Oracle Corporation dan menghabiskan bertahun-tahun sebagai konsultan untuk perusahaan besar termasuk Sun Microsystems, SGI dan Aspect Communications. Dia lulus dari Universitas California, Berkeley.