Databus vs. Database:6 Pertanyaan yang Harus Ditanyakan Setiap Pengembang IIoT
Industrial Internet of Things (IIoT) penuh dengan istilah yang membingungkan. Itu tidak bisa dihindari; terlepas dari penggunaan kembali konsep-konsep yang sudah dikenal dalam komputasi dan sistem, IIoT adalah perubahan mendasar dalam cara kerja berbagai hal. Perubahan mendasar membutuhkan konsep fundamental baru. Salah satu yang paling penting adalah konsep "databus".
Arsitektur referensi IIC versi 2 yang akan segera dirilis berisi pola baru yang disebut pola "databus berlapis". Saya tidak bisa mengatakan lebih banyak sekarang tentang rilis IIC, tetapi melalui proses dokumentasi sangat bagus untuk mendorong definisi yang tajam.
Definisi bus data adalah:
Databus adalah teknologi berbagi informasi data-sentris yang mengimplementasikan ruang data global virtual. Aplikasi perangkat lunak membaca dan memperbarui entri dalam ruang data global. Pembaruan dibagikan antar aplikasi melalui mekanisme komunikasi terbitkan-berlangganan.
Karakteristik utama dari databus adalah:
- peserta/aplikasi langsung berinteraksi dengan data,
- infrastruktur memahami, dan karena itu dapat memfilter data secara selektif, dan
- infrastruktur memberlakukan aturan dan jaminan parameter Kualitas Layanan (QoS) seperti kecepatan, keandalan, dan keamanan aliran data.
Tentu saja, konsep baru menimbulkan pertanyaan. Beberapa pertanyaan terbaik datang dari seorang arsitek dari perusahaan database besar. Kami biasanya mencoba menjelaskan konsep databus dari perspektif seorang arsitek jaringan atau perangkat lunak. Tapi, ilmu data mungkin merupakan pendekatan yang lebih baik. Bagaimanapun juga, database dan databus adalah konsep ilmu data.
Mari kita lihat 6 pertanyaan paling umum.
Pertanyaan 1:Bagaimana databus berbeda dari database (dalam bentuk apa pun)?
Jawaban singkat:basis data mengimplementasikan penyimpanan data-centric. Ini menghemat lama informasi yang nantinya dapat Anda cari dengan menghubungkan properti dari data yang disimpan. Sebuah databus mengimplementasikan interaksi data-centric. Ia mengatur masa depan informasi dengan membiarkan Anda memfilter berdasarkan properti dari data yang masuk.
Jawaban panjang:Sentrisitas data dapat ditentukan oleh properti berikut:
- Antarmuka adalah data. Tidak ada pembungkus atau pemblokir buatan untuk antarmuka tersebut seperti pesan, atau objek, atau file, atau pola akses.
- Infrastruktur memahami data itu. Ini memungkinkan pemfilteran/pencarian, alat, &selektivitas. Ini memisahkan aplikasi dari data dan dengan demikian menghilangkan banyak kerumitan dari aplikasi.
- Sistem mengelola data dan menerapkan aturan tentang cara aplikasi bertukar data. Ini memberikan gagasan tentang "kebenaran". Ini memungkinkan masa pakai data, pencocokan model data, antarmuka CRUD, dll.
Database relasional adalah teknologi penyimpanan data-sentris. Sebelum database, sistem penyimpanan adalah file dengan struktur yang ditentukan aplikasi (ad hoc). Basis data juga merupakan file, tetapi ini adalah file yang sangat istimewa. Sebuah database tahu bagaimana menafsirkan data dan memberlakukan kontrol akses. Sebuah database dengan demikian mendefinisikan "kebenaran" untuk sistem; data dalam database tidak dapat rusak atau hilang.
Dengan menerapkan aturan sederhana yang mengontrol model data, database memastikan konsistensi. Dengan mengekspos data untuk pencarian dan pengambilan oleh semua pengguna, database sangat memudahkan integrasi sistem. Dengan memungkinkan penemuan data dan skema, database juga memungkinkan alat umum untuk memantau, mengukur, dan menggali informasi.
Seperti database, middleware data-centric (databus) memahami isi dari data yang dikirimkan. Databus juga mengirim pesan, tetapi mengirimkan pesan yang sangat khusus. Ini hanya mengirim pesan yang secara khusus diperlukan untuk mempertahankan status. Aturan yang jelas mengatur akses ke data, bagaimana data dalam sistem berubah, dan kapan peserta mendapatkan pembaruan. Yang penting, hanya infrastruktur yang mengirim pesan. Untuk aplikasi, sistem terlihat seperti ruang data global yang terkontrol. Aplikasi berinteraksi langsung dengan data dan data properti "Quality of Service" (QoS) seperti usia dan tarif. Tidak ada kesadaran tingkat aplikasi atau konsep "pesan". Program yang menggunakan databus membaca dan menulis data, mereka tidak mengirim dan menerima pesan.
Database menggantikan file dengan penyimpanan data-centric yang menemukan data lama yang benar melalui pencarian. Databus menggantikan pesan dengan konektivitas data-centric yang menemukan data masa depan yang tepat melalui pemfilteran. Kedua teknologi tersebut membuat integrasi sistem menjadi lebih mudah, mendukung skala yang jauh lebih besar, keandalan yang lebih baik, dan interoperabilitas aplikasi.
Dengan pengetahuan tentang struktur dan permintaan pada data, infrastruktur databus dapat melakukan hal-hal seperti menyaring informasi, memilih kapan atau bahkan apakah akan melakukan pembaruan. Infrastruktur itu sendiri dapat mengontrol QoS seperti kecepatan pembaruan, keandalan, dan pemberitahuan jaminan keaktifan rekan. Infrastruktur dapat menemukan aliran data dan menawarkannya ke aplikasi dan alat generik. Pengetahuan tentang status data ini, dalam sistem terdistribusi, adalah definisi yang jelas dari "kebenaran". Seperti dalam database, infrastruktur memaparkan data, baik struktur maupun konten, ke aplikasi lain. Sumber kebenaran yang dapat diakses ini sangat memudahkan integrasi sistem. Ini juga memungkinkan alat dan layanan umum yang memantau dan melihat aliran informasi, merutekan pesan, dan mengelola caching.
Pertanyaan 2:"Aplikasi perangkat lunak membaca dan memperbarui entri dalam ruang data global. Pembaruan dibagikan antar aplikasi melalui mekanisme komunikasi terbitkan-berlangganan." Apakah itu berarti bahwa ini adalah database yang berinteraksi dengan Anda melalui antarmuka pub-sub?
Jawaban singkat:Tidak, tidak ada database. Basis data menyiratkan penyimpanan:data secara fisik berada di suatu tempat. Databus mengimplementasikan konsep virtual murni yang disebut "ruang data global".
Jawaban panjang:Ruang data bus data menentukan cara berinteraksi dengan informasi masa depan. Misalnya, jika "Anda" adalah pengontrol persimpangan, Anda dapat berlangganan pembaruan kendaraan dalam jarak 200m dari posisi Anda. Pembaruan tersebut kemudian akan dikirimkan kepada Anda, jika ada kendaraan yang mendekat. Pengiriman dijamin dalam banyak cara (mulai dalam 0,01 detik, diperbarui 100x/dtk, andal, dll.). Perhatikan bahwa data mungkin tidak pernah disimpan sama sekali. (Meskipun beberapa pengaturan QoS seperti keandalan mungkin memerlukan beberapa penyimpanan lokal.) Anda dapat menganggap ruang data sebagai kumpulan objek data yang dikontrol secara khusus yang akan diisi dengan informasi dengan cara yang Anda tentukan, meskipun informasi tersebut tidak (dalam umum) disimpan oleh databus... baru saja dikirim.
Pertanyaan 3:"Peserta/aplikasi berinteraksi langsung dengan data." Bisakah Anda menjelaskan apa artinya?
Dengan middleware "message-centric", Anda menulis aplikasi yang mengirim data, dibungkus dengan pesan, ke aplikasi lain. Anda dapat melakukannya dengan meminta klien mengirim data ke server, misalnya. Kedua ujungnya perlu mengetahui sesuatu tentang ujung yang lain, biasanya termasuk hal-hal seperti skema, tetapi juga kemungkinan mengasumsikan properti data seperti "berusia kurang dari 0,01 detik", atau "akan datang 100x/detik", atau setidaknya bahwa ada tujuan lain yang hidup, misalnya server sedang berjalan. Semua properti yang diasumsikan ini sepenuhnya tersembunyi dalam kode aplikasi, membuat penggunaan kembali, integrasi sistem, dan interoperabilitas menjadi sangat sulit.
Dengan databus, Anda tidak perlu tahu apa-apa tentang aplikasi sumber. Anda memperjelas kebutuhan data Anda, dan kemudian databus mengirimkannya. Jadi, dengan databus, setiap aplikasi hanya berinteraksi dengan ruang data. Sebagai aplikasi, Anda cukup menulis ke ruang data atau membaca dari ruang data dengan antarmuka CRUD. Tentu saja, Anda mungkin memerlukan beberapa QoS dari ruang data itu, mis. Anda perlu data Anda diperbarui 100x per detik. Ruang data itu sendiri (databus) akan menjamin Anda mendapatkan data itu (atau menandai kesalahan). Anda tidak perlu tahu apakah hanya ada satu atau 27 sumber data yang redundan, atau apakah itu datang melalui jaringan atau memori bersama, atau apakah itu program C di Linux atau program C# di Windows. Semua interaksi dilakukan dengan pandangan Anda sendiri tentang ruang data. Masuk akal juga, misalnya, untuk menulis data ke ruang tanpa penerima. Dalam hal ini, databus mungkin tidak melakukan apa-apa, atau mungkin menyimpan informasi untuk pengiriman nanti, tergantung pada pengaturan QoS Anda.
Perhatikan bahwa baik teknologi database dan databus menggantikan interaksi aplikasi-aplikasi dengan interaksi aplikasi-data-aplikasi. Abstraksi ini sangat penting. Ini memisahkan aplikasi dan sangat memudahkan penskalaan, interoperabilitas, dan integrasi sistem. Perbedaannya sebenarnya adalah salah satu data lama yang disimpan dalam database (kemungkinan terpusat), vs data masa depan yang dikirim langsung ke aplikasi dari ruang data terdistribusi.
Pertanyaan 4:"Infrastruktur memahami, dan karena itu dapat menyaring data secara selektif." Bukankah itu berlaku untuk semua pub-sub, tempat Anda dapat mendaftar untuk "acara" yang menarik bagi Anda?
Kebanyakan pub
[1] [2] 下一页