Algoritma Pembelajaran Mesin Revolusioner Mendeteksi ID Palsu di Media Sosial
- Peneliti Mengembangkan metode baru, berdasarkan teknik pembelajaran mesin, untuk mengidentifikasi pengguna palsu di platform media sosial.
- Algoritme ini didasarkan pada asumsi bahwa pengguna palsu cenderung membuat tautan yang tidak pantas ke pengguna lain.
- Hasilnya menunjukkan bahwa algoritme mampu mendeteksi pengguna asli dan pengguna jahat.
Mengidentifikasi pengguna palsu telah menjadi prioritas pertama bagi perusahaan jejaring sosial, terutama setelah penggunaan situs sosial yang ditargetkan oleh Rusia untuk mempengaruhi pemilu AS, dan kegagalan untuk menjaga privasi pengguna.
Kini, para peneliti di Universitas Washington dan Universitas Negev telah membuat algoritme pembelajaran tanpa pengawasan umum yang baru untuk menemukan pengguna palsu di platform jejaring sosial seperti Twitter dan Facebook.
Algoritme baru ini didasarkan pada prediksi bahwa pengguna palsu cenderung membuat tautan tidak pantas ke pengguna lain di jaringan. Para peneliti telah memasukkan metode prediksi tautan ke dalam model deteksi anomali yang tidak memerlukan pengetahuan grafik sebelumnya.
Bagaimana Algoritma Bekerja?
Topologi graf telah digunakan untuk membangun metode umum baru untuk mendeteksi simpul anomali dalam jaringan yang besar dan kompleks. Algoritme ini memiliki 2 iterasi utama berdasarkan teknik machine learning.
- Buat pengklasifikasi prediksi tautan untuk memperkirakan probabilitas tautan antara dua pengguna.
- Buat kumpulan fitur meta baru, berdasarkan fitur yang dihasilkan oleh pengklasifikasi prediksi tautan.
Para peneliti telah mengusulkan 7 fitur baru yang diharapkan menjadi prediktor efektif untuk mendeteksi anomali. Untuk menentukan fitur baru mana yang paling berpengaruh, mereka menguji kepentingannya menggunakan algoritme pemilihan atribut perolehan informasi Weka.
Referensi:SpringerLink | doi:10.1007/s13278-018-0503-4 | BGU
Kemudian mereka melakukan evaluasi eksperimental ekstensif pada 3 jenis jaringan kompleks – jaringan dunia nyata dengan simpul anomali berlabel, jaringan dunia nyata dengan simulasi simpul anomali, dan jaringan simulasi penuh.
Berbicara tentang kumpulan data, mereka menggunakan 10 jaringan berbeda, termasuk Flixster10, Dblp8, Yelp, Academia.edu, ArXiv5, dan Twitter.
Simpul merah menunjukkan simpul anomali, dan tepi merah memiliki kemungkinan palsu paling kecil
Hasilnya menunjukkan bahwa algoritme tersebut mampu mendeteksi orang asli dan pengguna jahat di jaringan nyata, termasuk Twitter. Teknologi ini mengungguli teknik deteksi anomali lainnya, dan menurut pengembangnya, teknik ini memiliki potensi untuk berbagai aplikasi, terutama di bidang keamanan siber.
Apa Selanjutnya?
Pengembang berencana untuk menguji algoritme untuk jenis jaringan lain, seperti grafik berbobot dan bipartit. Mereka juga akan mempelajari apa yang terjadi pada properti jaringan ketika tepi dan simpul acak digabungkan.
Mereka akan menunjukkan lebih lanjut bagaimana algoritma yang sama dapat digunakan untuk mendeteksi akun yang dibajak di platform sosial. Selain itu, menarik untuk melihat skala serangan Sybil yang perlu diterapkan sehingga tidak mungkin lagi membedakan antara simpul asli dan palsu.
Baca:22 Alat Analisis Jaringan Sosial Gratis
Untuk saat ini, para peneliti telah mempublikasikan semua kode dan data secara online, termasuk kumpulan data dunia nyata yang berisi tanda pengenal palsu. Siapa pun dapat menggunakannya sebagai kerangka kerja terbuka, menyempurnakan metode deteksi anomali titik di masa depan, dan membandingkan hasilnya.