Manufaktur industri
Industri Internet of Things | bahan industri | Pemeliharaan dan Perbaikan Peralatan | Pemrograman industri |
home  MfgRobots >> Manufaktur industri >  >> Manufacturing Technology >> Sistem Kontrol Otomatisasi

Evolusi penglihatan 3D

Visi 3D adalah inti dari otomatisasi modern yang meningkatkan proses industri dengan berbagai cara dan membuat hidup kita lebih mudah. Ini membantu kami menyortir produk, memeriksa objek dalam aplikasi kontrol kualitas dan menemukan cacat pada produk, dan juga menyelesaikan berbagai tugas dengan lebih cepat dan lebih efisien daripada yang dapat dilakukan manusia. Robot yang dipandu oleh penglihatan biasanya digunakan untuk melakukan tugas berbahaya dan menangani benda berat, jadi robot ini juga meningkatkan keamanan dan menghilangkan risiko cedera.

Teknologi penginderaan 3D telah berjalan jauh untuk memberikan semua manfaat yang dapat kita nikmati hari ini – dan mereka masih terus maju. Dari foto pertama hingga pencitraan digital, dari 2D hingga 3D, dan dari pemindaian objek statis 3D hingga pengambilan adegan dinamis. Apa yang akan terjadi selanjutnya?

Bersama dengan Tomas Kovacovsky, salah satu pendiri dan CTO dari Photoneo Group, kami melihat sejarah visi mesin 3D hingga kemajuan terbaru yang mendominasi tren saat ini seperti Industri 4.0. Mari kita lihat sekilas.

Fotografi dan teknologi pertama untuk pengambilan gambar

Sejak awal fotografi, orang telah terpesona oleh kemungkinan untuk mengabadikan dan merekam peristiwa. Gambar foto pertama yang diketahui diambil di suatu tempat antara tahun 1826 dan 1827 oleh penemu Perancis Joseph Nicéphore Niépce. Sementara proses fotografinya membutuhkan setidaknya delapan jam jika tidak beberapa hari pemaparan di kamera, rekannya Louis Daguerre mengembangkan proses fotografi pertama yang diumumkan secara publik (dikenal sebagai Daguerreotype) yang hanya membutuhkan beberapa menit pemaparan. Penemuan ini diperkenalkan ke publik pada 1839 – tahun yang umumnya dianggap kelahiran fotografi praktis.

Selama ini, fotografi hanya berfungsi sebagai media untuk merekam peristiwa. Karena pemrosesan gambar memakan waktu agak lama, teknologi analog tidak ideal digunakan untuk visi mesin atau tugas pengambilan keputusan.

Pada tahun 1969, William Boyle dan George E. Smith dari American Bell Laboratories menemukan Sensor CCD (charge-coupled device) untuk merekam gambar , yang merupakan tonggak penting dalam pengembangan pencitraan digital. Sensor CCD menangkap gambar dengan mengubah foton menjadi elektron – yaitu mengambil cahaya dan menerjemahkannya menjadi data digital. Meskipun CCD tidak dapat bersaing dengan film standar untuk pengambilan gambar pada saat itu, CCD mulai digunakan untuk aplikasi tertentu dan bola mulai bergulir.

Dari 2D ke 3D

Penginderaan 2D meluncurkan era otomatisasi dan itu adalah pendekatan umum dalam otomasi sektor industri untuk waktu yang lama. Penglihatan 2D digunakan dalam beberapa aplikasi sederhana bahkan saat ini, termasuk yang berikut:

  • Pengenalan karakter optik (OCR) – membaca teks yang diketik, ditulis tangan, atau dicetak; pembacaan kode batang
  • Kontrol kualitas – sering kali digunakan dalam kombinasi dengan pencahayaan khusus untuk memastikan kualitas optik objek yang dipindai tetap sama
  • Menghitung
  • Memilih item dalam kondisi yang ditentukan dengan baik

Namun, batasan utama dari teknologi 2D adalah bahwa mereka tidak dapat mengenali bentuk objek atau mengukur jarak dalam dimensi Z.

Aplikasi 2D membutuhkan kondisi yang baik dan terdefinisi dengan baik dengan pencahayaan tambahan, yang juga membatasi aplikasi seperti pengambilan bin. Tugas robotik ini dapat dilakukan dengan sistem penglihatan 2D, tetapi umumnya bermasalah karena posisi objek yang acak di tempat sampah dan banyaknya informasi dalam pemandangan yang tidak dapat ditangani oleh sistem penglihatan 2D.

Orang menyadari kebutuhan akan informasi 3D agar dapat mengotomatiskan tugas yang lebih kompleks. Mereka memahami bahwa manusia dapat melihat sekelilingnya dalam tampilan 3D dan mengetahui jarak objek karena mereka memiliki dua mata – penglihatan stereoskopik.

Pada tahun 1960-an, Larry Roberts , yang diterima sebagai Bapak Computer Vision , menjelaskan cara memperoleh informasi geometris 3D dari foto 2D gambar garis dan bagaimana komputer dapat membuat model 3D dari satu foto 2D.

Pada tahun 1970-an, kursus "Visi Mesin" dimulai di Lab Kecerdasan Buatan MIT untuk menangani tugas-tugas visi mesin tingkat rendah. Di sini, David Marr mengembangkan pendekatan unik untuk pemahaman adegan melalui visi komputer, di mana dia menapaki visi sebagai sistem pemrosesan informasi. Pendekatannya dimulai dengan sketsa 2D, yang dibangun di atas komputer untuk mendapatkan gambar 3D final.

Penelitian dalam visi mesin diintensifkan pada 1980-an dan menghasilkan teori dan konsep baru. Ini memunculkan sejumlah teknologi visi mesin 3D yang berbeda, yang secara bertahap telah diadopsi di lingkungan industri dan manufaktur untuk mengotomatiskan rangkaian proses terluas.

Teknologi penglihatan 3D pertama

Upaya meniru penglihatan stereoskopis manusia menghasilkan pengembangan salah satu teknologi penginderaan 3D pertama – stereo pasif . Metode triangulasi ini mengamati pemandangan dari dua titik pandang dan menghitung segitiga kamera – objek yang dipindai – kamera , mencari korelasi antara dua gambar. Berdasarkan perbedaan antara gambar, ini menghitung jarak (kedalaman) dari objek yang dipindai. Namun, pendekatan ini bergantung pada penemuan detail identik dalam gambar sehingga tidak bekerja dengan baik dengan dinding putih atau pemandangan tanpa pola. Keandalan stereo pasif kecil dan output 3D biasanya memiliki noise tinggi dan memerlukan banyak daya komputasi.

Untuk mengkompensasi kelemahan ini, peneliti mulai bereksperimen dengan memproyeksikan pola cahaya ke pemandangan untuk menciptakan tekstur buatan di permukaan dan mengidentifikasi korespondensi di pemandangan dengan lebih mudah. Metode ini disebut stereo aktif . Meskipun metode ini lebih andal daripada stereo pasif, kualitas rekonstruksi sering dikompromikan oleh persyaratan waktu pemrosesan yang ketat, yang membuatnya tidak cukup untuk banyak aplikasi.

Salah satu metode paling awal dan masih sangat populer untuk memperoleh informasi 3D adalah profilometri laser . Teknik ini memproyeksikan pita cahaya sempit (atau titik) ke permukaan 3D, yang menghasilkan garis iluminasi yang tampak terdistorsi dari sudut selain dari sudut proyektor. Penyimpangan ini mengkodekan informasi kedalaman. Pemindai garis menangkap satu profil kedalaman pada satu waktu secara berurutan, yang memerlukan objek yang dipindai atau kamera untuk terus bergerak. Profilometri laser adalah salah satu metode pemindaian 3D pertama yang diadopsi untuk penggunaan industri dan masih sangat populer dalam aplikasi metrologi, misalnya.

Metode lain yang ditemukan dengan memproyeksikan pola cahaya terstruktur ke sebuah pemandangan adalah cahaya terstruktur . Salah satu karya yang paling banyak dikutip membahas penggunaan cahaya terstruktur dengan kode biner untuk pemulihan digital adalah The Digital Michelangelo Project dipimpin oleh Marc Levoy dan timnya di Stanford University. Proyek ini dimulai pada tahun 1998 untuk mendigitalkan patung-patung Michelangelo dengan menggunakan proyektor dan sensor kamera. Data pemindaian laser untuk David karya Michelangelo kemudian digunakan untuk restorasi patung yang dimulai pada tahun 2002. Meskipun metode yang digunakan dalam proyek ini tidak cukup cepat untuk digunakan dalam aplikasi waktu nyata, metode ini memberikan akurasi sangat tinggi yang diperlukan untuk digitalisasi berbagai artefak dan benda. Berkat ini, teknologi menemukan ceruknya dalam aplikasi metrologi dan tugas robotik dan penglihatan mesin lainnya yang membutuhkan presisi pemindaian tinggi.

Secara bertahap, teknologi cahaya terstruktur berkembang melampaui metrologi dan menembus semua jenis aplikasi online menggunakan robot yang dipandu oleh penglihatan. Keuntungan dari pemindai 3D cahaya terstruktur adalah tidak memerlukan gerakan. Karena mereka dapat membuat snapshot dari seluruh area pemindaian dan seseorang tidak perlu mengelilingi seluruh objek dengan pemindai, mereka lebih cepat daripada perangkat berdasarkan profilometri laser dan tidak memerlukan begitu banyak pemrosesan pasca data.

Dari adegan statis ke dinamis

Menangkap gerakan jauh lebih menantang daripada pemindaian 3D adegan statis dan mendiskualifikasi metode yang memerlukan waktu akuisisi lebih lama.

Karena stereo pasif adalah metode pasif yang tidak menggunakan pencahayaan tambahan apa pun, metode ini dapat digunakan untuk menangkap pemandangan yang dinamis, tetapi hanya jika kondisi tertentu terpenuhi. Meski begitu, hasilnya tidak akan bagus.

Profilometri laser bukanlah metode yang jauh lebih sukses daripada stereo pasif dalam hal ini. Karena menangkap satu profil pada satu waktu, untuk membuat snapshot keseluruhan dari pemandangan, kamera atau pemandangan harus bergerak. Namun, teknologi tersebut tidak dapat menangkap peristiwa yang dinamis. Untuk merekonstruksi kedalaman profil tunggal, diperlukan pengambilan gambar pindaian area sempit, di mana ukurannya membatasi kecepatan bingkai dan juga kecepatan pemindaian.

Cahaya terstruktur sistem, di sisi lain, memproyeksikan beberapa pola cahaya ke pemandangan secara berurutan, satu demi satu. Untuk ini, pemandangan harus statis. Jika objek yang dipindai atau kamera bergerak, kode akan rusak dan awan titik 3D akan terdistorsi.

Kebutuhan untuk membuat rekonstruksi 3D objek dinamis mengarah pada pengembangan Time-of-Flight (ToF) sistem. Mirip dengan teknologi cahaya terstruktur, ToF adalah metode aktif yang mengirimkan sinyal cahaya ke tempat kejadian dan kemudian menginterpretasikan sinyal tersebut dengan kamera dan perangkat lunaknya. Berbeda dengan cahaya terstruktur, ToF menyusun cahaya dalam waktu dan bukan dalam ruang. Ini bekerja berdasarkan prinsip mengukur waktu selama sinyal cahaya yang dipancarkan dari sumber cahaya mengenai objek yang dipindai dan kembali ke sensor.

Sistem ToF pertama memiliki kualitas yang agak rendah. Pemain besar di bidang ini termasuk perusahaan seperti Canesta, 3DV Systems, atau Microsoft (yang kemudian mengakuisisi kedua perusahaan tersebut). Salah satu proyek awal yang terkenal adalah ZCam – kamera Time-of-Flight yang dikembangkan oleh 3DV dan kemudian dibeli oleh Microsoft untuk digunakan dalam akuisisi informasi 3D dan interaksi dengan objek virtual di konsol video game Microsoft Xbox.

Pada tahun 2010, Microsoft merilis sistem sensor Kinect untuk Xbox, kamera penginderaan gerak yang didasarkan pada teknologi PrimeSense. Teknologi PrimeSense menggunakan pola terstruktur untuk menyandikan piksel tertentu (tidak semuanya) dan mendapatkan informasi 3D. Meskipun metode ini tidak dapat memberikan resolusi tinggi dan kontur detail pada tepi objek yang dipindai, metode ini diadopsi secara luas karena kecepatan pemrosesannya cukup cepat dan teknologinya juga sangat terjangkau. Ini telah digunakan terutama di bidang akademik tetapi hampir tidak dapat ditemukan di lingkungan industri untuk pengambilan robot dan tugas lainnya.

Berbeda dengan Kinect 1, Kinect 2 didasarkan pada teknologi ToF. Kemajuan dalam ToF menyebabkan metode ini menjadi semakin populer dan diadopsi secara luas – dapat memberikan kualitas yang lebih tinggi daripada teknologi PrimeSense, namun resolusi pindaian 3D adegan dinamis masih belum memadai.

Sistem ToF saat ini cukup populer dalam aplikasi visi 3D berkat kecepatan pemindaiannya yang cepat dan akuisisi yang hampir real-time. Namun, penyelesaiannya masih menjadi masalah dan mereka juga kesulitan dengan tingkat kebisingan yang lebih tinggi.

Pada tahun 2013, Photoneo mendapatkan ide revolusioner tentang cara menangkap objek yang bergerak cepat untuk mendapatkan informasi 3D dalam resolusi tinggi dan akurasi submilimeter.

Teknologi Lampu Terstruktur Paralel yang telah dipatenkan didasarkan pada sensor CMOS eksklusif yang menampilkan rana multi-ketuk dengan pola piksel mosaik, yang secara fundamental mengubah cara pengambilan gambar.

Pendekatan snapshot baru ini menggunakan cahaya terstruktur tetapi menukar peran kamera dan proyektor:Sementara sistem cahaya terstruktur memancarkan banyak pola dari proyektor secara berurutan, teknologi Cahaya Terstruktur Paralel mengirimkan sapuan laser yang sangat sederhana, tanpa pola, ke seluruh pemandangan dan membangun pola di sisi lain – di sensor CMOS. Semua ini terjadi dalam satu contoh waktu dan memungkinkan pembuatan beberapa gambar virtual dalam satu jendela eksposur. Hasilnya adalah gambar 3D beresolusi tinggi dan akurasi tinggi dari adegan bergerak tanpa artefak gerak.

Pemandangan dinamis yang ditangkap oleh teknologi Cahaya Terstruktur Paralel .

Teknologi Cahaya Terstruktur Paralel diimplementasikan dalam kamera 3D MotionCam-3D Photoneo. Pengembangan kamera dan peluncurannya ke pasar menandai tonggak sejarah dalam sejarah visi mesin karena mendefinisikan kembali robotika yang dipandu visi dan memperluas kemungkinan otomatisasi ke tingkat yang belum pernah terjadi sebelumnya. Pendekatan baru diakui dengan banyak penghargaan, termasuk Vision Award 2018 , Penghargaan Platinum Inovator Desain Sistem Vision 2019 , Inovasi Teratas inVision 2019 , Penghargaan IERA 2020 , Penghargaan Inovasi Robotika RBR50 Tinjauan Bisnis Robotika 2021 , Inovasi Teratas inVision 2021 , dan Penghargaan Terobosan SupplyTech 2022 .

Pemindaian 3D bergerak dan berwarna

Pada tahun 2022 Photoneo memperluas kemampuan MotionCam-3D dengan melengkapinya dengan unit warna untuk menangkap data warna. MotionCam-3D Color dianggap sebagai peluru perak berikutnya dalam visi mesin karena akhirnya memungkinkan pembuatan awan titik 3D warna-warni secara real-time dari adegan bergerak dalam kualitas sempurna. Berkat kombinasi unik geometri 3D, gerakan, dan warna, kamera membuka pintu untuk aplikasi AI yang menuntut dan tugas robotik yang tidak hanya mengandalkan informasi kedalaman tetapi juga data warna.

Pembuatan awan titik 3D warna-warni real-time dari adegan bergerak menggunakan MotionCam-3D Color .

Area aplikasi yang diaktifkan oleh inovasi visi mesin

Kemungkinan yang ditawarkan oleh inovasi terbaru dalam visi mesin 3D memungkinkan kami mengotomatiskan tugas yang sebelumnya tidak dapat dilakukan. Aplikasi ini dapat ditemukan di bidang manufaktur, logistik, otomotif, bahan makanan, pertanian, obat-obatan, dan sektor lainnya dan meliputi:

  • Penanganan objek secara robotik dalam gerakan konstan atau acak
  • Mengambil dari ban berjalan dan konveyor di atas kepala
  • Manipulasi tangan-mata
  • Pembuatan model 3D untuk inspeksi dan kontrol kualitas
  • Membersihkan dan mengecat benda besar
  • Operasi pemeliharaan di VR/AR
  • Memilah dan memanen di bidang pertanian
  • Dan masih banyak lagi

Apa yang akan terjadi selanjutnya?

Visi mesin terus berkembang untuk menghadirkan kemajuan baru dengan kemungkinan baru. Arah inovasi selalu dipengaruhi oleh tuntutan pasar, harapan pelanggan, persaingan, dan faktor lainnya.

Kami dapat berharap bahwa tren penerapan AI di semua area visi mesin pasti akan berlanjut dengan tujuan untuk menghilangkan pengembangan algoritme yang dibuat khusus. Kita dapat melihat potensi besar di bidang kecerdasan buatan (AI) dan kombinasinya dengan teknologi Cahaya Terstruktur Paralel. Di satu sisi, AI bergantung pada data yang bagus. Di sisi lain, teknologi visi mesin yang baru dapat menyediakan sejumlah besar data 3D nyata berkualitas tinggi. Menggabungkan kedua pendekatan ini dapat mengubah robotika cerdas dan memungkinkan peluang baru.

Arah lain yang menjanjikan dari perkembangan masa depan adalah komputasi tepi . Produsen cenderung melanjutkan upaya mereka untuk mengintegrasikan AI langsung ke sensor dan mengkhususkannya untuk tujuan yang ditentukan (misalnya penghitungan orang, penentuan dimensi, atau deteksi otomatis fitur objek yang ditentukan), membuat penyebaran lebih mudah bagi integrator dan meminimalkan kebutuhan akan komponen tambahan. Solusi perangkat keras baru yang mampu menangkap adegan bergerak yang dipadukan dengan algoritme AI canggih akan memperluas bidang aplikasi yang terus meluas bahkan di area yang lebih menantang seperti robotika kolaboratif atau otomatisasi logistik lengkap.


Sistem Kontrol Otomatisasi

  1. Apa Realitas Visi Robot?
  2. Evolusi Pemeliharaan Industri
  3. Inspeksi Visi Mesin:Alat Perdagangan
  4. Cisco Cyber ​​Vision:Di balik kap mesin
  5. Evolusi Praktik Pemeliharaan
  6. Kekuatan visi yang jelas dan ringkas
  7. Apakah 5G akan mewujudkan visi 2020 ?
  8. Evolusi Bahan Medis
  9. Evolusi mesin medis
  10. Evolusi Layanan Dinamis Houston