AI dan pemahaman semantik — tahap selanjutnya dalam evolusi NLP sudah dekat
AI hampir mencapai pemahaman tentang semantik sebagai langkah selanjutnya dalam evolusinya
AI adalah keliru, atau begitulah yang sering disarankan. Huruf pertama — artifisial — hampir benar. Adapun kata kedua — yah, tidak ada yang cerdas tentang itu. Ambil contoh semantik, tidak ada yang cerdas, atau sebaliknya, tentang teknologi buatan yang memahami makna dalam kalimat, paragraf, dan buku karena alasan sederhana, itu sangat buruk dalam hal itu.
Tapi mungkinkah ini akan berubah? Baru-baru ini, kami duduk bersama Hadayat Seddiqi, direktur pembelajaran mesin di perusahaan teknologi hukum InCloudCounsel. Dia menganggap bahwa AI hampir mencapai pemahaman tentang semantik sebagai langkah selanjutnya dalam evolusinya. Kami bertanya:“kapan kita akan mencapai tonggak sejarah ini?”
SEO:jika Anda seorang penulis, yang bangga dengan tulisan Anda, dalam menerapkan leksikon Anda untuk mengekspresikan ide tanpa pengulangan, maka Anda mungkin membenci SEO. Jika Anda suka membuat argumen yang kompleks, yang hanya bisa diungkapkan dalam satu kalimat, bab, artikel, atau bahkan buku, maka SEO, karena caranya membuat argumen bodoh Anda menjadi dua atau tiga atau empat kata, seperti AI dan pemahaman semantik, adalah musuh. (Lihat apa yang kami lakukan, di sana?)
Bukankah lebih bagus jika penelusuran, menggunakan AI untuk memahami semantik (kita mulai lagi) dapat membuat hasil penelusuran berdasarkan pemahaman yang jauh lebih canggih — cerdas, jika Anda mau —, menghilangkan kebutuhan akan pengulangan yang membosankan!
Pasar pemrosesan bahasa alami sebenarnya diperkirakan akan mencapai $22,3 miliar pada tahun 2025– yang menggambarkan seberapa jauh teknologi telah berkembang, terutama dalam cara kita berkomunikasi dan melakukan bisnis.
Saat ini, teknologi ini digunakan untuk berbagai tujuan dalam organisasi, termasuk pemantauan reputasi merek untuk menentukan analisis sentimen, memberikan wawasan tentang penempatan iklan melalui pencocokan kata kunci atau disambiguasi, dan bahkan dapat digunakan dalam kepatuhan terhadap peraturan untuk memastikan produk tidak 'tidak menjadi kewajiban.
Dalam hal ini, kekuatan AI yang sebenarnya untuk merevolusi industri dan menentukan wawasan bisnis utama, terletak pada kemampuannya membaca teks dan memahami semantik (atau hubungan antar kata) untuk membantu organisasi lebih jauh mengurangi risiko dan mengungkap kewajiban. Pada gilirannya, ini menciptakan nilai besar dalam pemrosesan bahasa alami.
Jadi, dalam kisah AI yang memungkinkan pemahaman semantik, apa langkah selanjutnya dalam evolusinya dan kapan kita akan mencapai tonggak sejarah ini?
Seddiqi mengatakan:“Mencapai pemahaman semantik dalam AI akan membutuhkan beberapa tonggak penting. Sangat membantu untuk memikirkan kemajuan berulang yang membawa kita ke pemahaman semantik dalam AI dan apa arti setiap tonggak sejarah.”
“Tonggak sejarah sebelumnya,” kata Seddiqi adalah Word Vectors:“Mari kita bingkai tonggak ini dalam kasus penggunaan umum yang kebanyakan orang kenal:fungsi pencarian di komputer. Setiap orang telah menggunakan Ctrl+F/Command+F untuk menemukan sesuatu di sistem mereka, yang menemukan apa yang Anda cari dengan mencocokkan kata kunci secara tepat. Selain itu, menggunakan mesin telusur seperti Google untuk menemukan informasi akan menyertakan komponen 'pemeriksaan ejaan' untuk mengatasi kemungkinan kesalahan ejaan.
“Tetapi bagaimana dengan kata-kata yang terlihat sangat berbeda tetapi memiliki arti yang serupa? Sekitar tahun 2013, komunitas AI menemukan cara yang efisien untuk memodelkan ini yang disebut 'vektor kata'. Anda dapat melakukan hal-hal aljabar kata yang menyenangkan, seperti King + Woman akan memberi Anda Ratu. Lebih praktis, Anda sekarang dapat memperluas pencarian Anda untuk memasukkan kata-kata yang terkait secara semantik.”
Tonggak sejarah yang akan datang dalam semantik pemahaman AI
“Vektor kata adalah pengubah permainan, tetapi mereka masih mengharuskan Anda untuk mengekspresikan ide Anda dalam satu atau beberapa kata kunci. Tetapi bagaimana jika ide Anda membutuhkan seluruh kalimat untuk diungkapkan? Itu adalah pencapaian berikutnya, yang kami capai berkat dorongan besar dalam penelitian tahun lalu.
“Idenya adalah Anda dapat mengambil sebuah kalimat, menyandikannya menjadi vektor kalimat (atau pemikiran) dan kemudian menemukan vektor kalimat yang serupa. Jika dikodekan dengan baik, fungsi pencarian Anda dapat menemukan kalimat yang tampak sangat berbeda yang mengekspresikan ide yang sama.
“Tidak masuk akal untuk mengatakan bahwa teknologi ini akan matang dalam beberapa tahun ke depan, berdasarkan kemajuan penelitian saat ini.
Pencapaian masa depan:pemahaman AI melampaui kalimat
“Ada pola hierarki yang jelas muncul dalam perkembangan teknologi ini. Kami semakin dekat dengan ide pemahaman AI pada tingkat kalimat menggunakan teknik serupa dari tingkat kata dan meningkatkannya. Ini membuka aplikasi menarik untuk ide pemahaman AI yang membutuhkan paragraf, seluruh dokumen, atau bahkan seluruh buku.
“Lompatan AI baru-baru ini untuk memahami kalimat dari kata-kata bukanlah hal yang sepele karena kemampuan untuk melakukannya sebagian besar dibatasi oleh ukuran kumpulan data dan kekuatan komputasi. Kemampuan kami untuk membuat model untuk menangani masalah yang lebih besar ini sejauh ini terbukti bergantung pada dua kendala sumber daya ini.
“Karena biaya ini menurun dari kemajuan perangkat keras AI, kami akan melihat diri kami semakin dekat dengan model yang memahami koleksi teks yang lebih besar. Ini agak dibuktikan dengan model GPT-2 Open AI, yang menunjukkan bahwa menggunakan desain model pengkodean kalimat yang sama dengan sejumlah besar data, menghasilkan model yang sudah memahami konsep tingkat tinggi di banyak kalimat. Misalnya, GPT-2 cukup memahami untuk menulis seluruh artikel berita dengan koherensi yang menakjubkan.