Manufaktur industri
Industri Internet of Things | bahan industri | Pemeliharaan dan Perbaikan Peralatan | Pemrograman industri |
home  MfgRobots >> Manufaktur industri >  >> Pemeliharaan dan Perbaikan Peralatan

Toleransi Kesalahan Dan Dampaknya Pada Keandalan Sistem


Peralatan dan sistem yang dirancang tanpa mempertimbangkan toleransi kesalahan sering kali memiliki keandalan yang buruk.

Inilah sebabnya mengapa desain sistem yang toleran terhadap kesalahan adalah pilihan yang jelas bagi sebagian besar insinyur desain dan keandalan – terutama jika menyangkut peralatan kritis yang kegagalannya dapat membahayakan keandalan, ketersediaan, kemampuan pemeliharaan, dan keamanan (RAMS) dari keseluruhan sistem. bagian dari.

Bergabunglah dengan kami saat kami menjelajahi karakteristik sistem toleransi kesalahan dan mendiskusikan cara untuk meningkatkan toleransi kesalahan melalui desain yang berlebihan.

Apa itu toleransi kesalahan?

Toleransi kesalahan mewakili kemampuan sistem atau peralatan apa pun untuk mempertahankan operasinya selama adanya kesalahan.

Sistem dan peralatan dengan toleransi kesalahan yang tinggi, tergantung pada mekanisme toleransi kesalahan yang diadopsi, dapat sepenuhnya atau sebagian mempertahankan operasinya pada saat terjadinya kesalahan. Agar ini berhasil dalam praktiknya, sistem seperti itu tidak boleh memiliki satu titik pun kegagalan (SPOF).

Inti dari desain yang toleran terhadap kesalahan 

Pengembangan desain yang toleran terhadap kesalahan memerlukan pertimbangan yang cermat terhadap kegagalan yang dapat dimanifestasikan di seluruh siklus hidup peralatan, bersama dengan kemungkinan penyebab dan konsekuensinya.

Namun, insinyur desain juga harus mempertimbangkan faktor biaya dan sumber daya yang diperlukan untuk mencapai tingkat toleransi, keandalan, dan ketergantungan peralatan yang diperlukan.

Hal ini sering disalahpahami bahwa desain toleransi kesalahan harus memberikan toleransi penuh untuk semua jenis kesalahan. Ini tidak benar. Desain yang baik harus sesuai dengan tingkat toleransi terhadap kekritisan kesalahan sehingga optimasi keseluruhan efisiensi biaya dan sumber daya dapat dicapai.

Misalnya, mungkin tidak hemat biaya untuk mengeluarkan uang untuk mendesain ulang produk, hanya untuk mengatasi kesalahan yang kemungkinannya sangat kecil untuk terjadi.

Karakteristik sistem yang toleran terhadap kesalahan

Untuk membuat sistem yang toleran terhadap kesalahan, upaya diperlukan di setiap tahap siklus hidup peralatan. Ini termasuk namun tidak terbatas pada spesifikasi dan fase desain (memasukkan kontrol deteksi kesalahan dalam desain), validasi dan verifikasi (V&V), pemeliharaan dan pengoperasian (menggunakan suku cadang pengganti yang disetujui OEM dan pedoman untuk perawatan rutin), dan bahkan tahap pembuangan .

Setiap tahap dapat mengadopsi kombinasi teknik yang disebutkan di bawah ini untuk mengembangkan desain baru atau meningkatkan yang ada saat ini untuk meningkatkan tingkat toleransi kesalahannya:

  1. deteksi dan tampilan kesalahan
  2. diagnosis kesalahan dan penahanan 
  3. penyembunyian kesalahan dan kompensasi 

1) Deteksi dan tampilan kesalahan

Deteksi kesalahan mengacu pada kemampuan sistem/peralatan untuk merasakan dan menampilkan kesalahan. Ini adalah aspek mendasar dari setiap sistem yang toleran terhadap kesalahan . Semua aspek lain bergantung pada efektivitas proses deteksi kesalahan. Jika sistem tidak dirancang untuk mendeteksi kesalahannya, atau entah bagaimana salah mendeteksi kesalahan, aspek lainnya juga tidak akan efektif.

Misalnya, sensor tekanan udara sederhana dalam sistem pemantauan tekanan ban mobil (TPMS) dapat mendeteksi pengisian udara yang berlebihan dan memberi tahu pengemudi melalui dasbor mobil.

Representasi dari aktivasi TPMS

Dalam hal ini, deteksi dan tampilan adalah satu-satunya tingkat toleransi yang dapat diterima untuk peristiwa kesalahan ini. Pelanggan dapat melepaskan selang udara dengan aman sebelum merusak ban.

Jika deteksi tekanan tidak akurat, pengemudi dapat melepaskan selang terlalu cepat/terlambat dan mengalami kegagalan ban selama mengemudi. Karena tidak ada koreksi otomatis tekanan udara, aspek toleransi untuk kesalahan ini dibatasi hanya untuk deteksi dan tampilan.

2) Diagnosis dan penahanan kesalahan

Dalam sistem yang lebih canggih, lapisan tambahan sering ditambahkan dalam tahap desain produk. Tujuannya adalah untuk mendiagnosis dan melakukan penahanan di atas deteksi dan tampilan. Lapisan tambahan ini dijamin karena kekritisan sistem atau karena berbagai masalah keamanan.

Misalnya, Sistem Kontrol Terdistribusi (DCS) – sistem kontrol untuk pabrik proses – tidak hanya memantau parameter proses penting melalui serangkaian sensor tetapi juga melakukan diagnosis untuk mendeteksi lokasi kesalahan dan melakukan penahanan yang diperlukan.

Representasi dari sistem DCS

Misalnya, dalam kasus tekanan berlebih dari produk minyak bumi di dalam bejana, sistem dipicu oleh sensor tekanan yang relevan. Ini membuka katup tekanan pengaman dan mengeluarkan uap keluar di tumpukan suar.

Dalam contoh ini, penahanan dilakukan dengan mengalihkan uap mudah terbakar bertekanan tinggi ke cerobong asap, melindungi sistem dari kebakaran atau ledakan.

3) Penyembunyian kesalahan dan kompensasi

Pendekatan lain yang efektif untuk toleransi kesalahan adalah dengan menutupi keadaan kesalahan. Sangat efektif untuk peralatan yang dapat dipantau dan dikendalikan melalui teknologi Internet of Things (IoT).

Dengan peralatan seperti itu, salah satu tantangan paling signifikan datang dalam bentuk ancaman keamanan siber. Jenis ancaman ini dapat mencoba untuk menyebabkan kesalahan dengan mengubah keadaan peralatan melalui injeksi data peralatan palsu ke server.

Dengan catatan status peralatan yang salah, sistem kontrol dan pemantauan yang awalnya dimaksudkan untuk melindungi malah dapat menyebabkan kegagalan aset. Atau, dapat "ditipu" untuk berpikir bahwa aset dalam kondisi baik padahal sebenarnya tidak – membiarkan penurunan kualitas menyebabkan kegagalan tanpa memicu peringatan apa pun.

Dengan menggabungkan penyembunyian kesalahan, sistem dirancang sedemikian rupa sehingga dapat mengenali dan menutupi nilai-nilai yang salah tersebut.

Misalnya, di jaringan listrik, pemutus sirkuit sering dikontrol dan dipantau melalui Pengawasan Kontrol dan Akuisisi Data (SCADA).

Representasi dari sistem SCADA

Sistem seperti itu memonitor secara ketat parameter tegangan dan frekuensi peralatan listrik dan menyebabkannya menutup atau membuka untuk menjaga stabilitas jaringan listrik.

Serangan siber yang masuk dapat mengubah batas tegangan dan frekuensi pada peralatan. Konsekuensi? Sistem dapat menyebabkan gangguan daya alih-alih mencegahnya.

Penyembunyian kesalahan sering dilakukan melalui algoritme yang mendeteksi aliran data anomali dan menyuntikkan data palsu dengan tujuan menutupi data yang mewakili keadaan peralatan yang salah. Ini mencegah pelaku data yang buruk menyebarkan kesalahan dan semakin memperburuk keandalan jaringan.

Meningkatkan toleransi kesalahan melalui desain yang berlebihan

Salah satu tindakan sederhana yang dapat diambil untuk meningkatkan toleransi kesalahan adalah dengan memasukkan redundansi dalam desain. Redundansi berarti adanya sistem atau solusi alternatif yang dapat mengambil alih fungsi yang dimaksudkan jika sistem utama gagal.

Sementara redundansi meningkatkan toleransi kesalahan, menambahkan sistem secara sembarangan tidak boleh menjadi tujuan karena jumlah biaya yang diperlukan untuk menambahkan sistem baru dapat secara signifikan lebih besar daripada manfaat keandalan yang dapat dicapai.

Dari perspektif peralatan fisik, mereka dapat secara luas diklasifikasikan sebagai aktif atau redundansi pasif .

Redundansi aktif

Redundansi aktif dapat dibuat ketika beberapa peralatan dioperasikan secara bersamaan. Dalam konfigurasi ini, setiap bagian dari peralatan memberikan kontribusinya untuk mencapai fungsi yang diinginkan sambil tetap bertindak sebagai redundansi satu sama lain.

Redundansi aktif yang sederhana adalah operasi paralel dua pompa pada setengah dari kapasitas pengenalnya. Kedua pompa bekerja bersama untuk mencapai tekanan pelepasan yang diinginkan. Jika satu pompa gagal, pompa lainnya masih dapat didorong ke kapasitas pengenalnya untuk mencapai tekanan pelepasan yang diinginkan dengan sendirinya. Untuk mencapai penghematan desain, para insinyur keandalan telah menemukan berbagai cara rumit lainnya untuk mencapai redundansi aktif seperti redundansi K dari N dan degradasi anggun.

Dalam K dari N redundansi , subset tertentu dari peralatan selalu beroperasi. Hal ini meningkatkan keandalan sistem karena beberapa peralatan masih dalam keadaan siaga panas dan dapat bergabung dengan operasi jika beberapa peralatan mengalami kegagalan. Ini menjamin keandalan yang lebih besar dibandingkan dengan operasi paralel sederhana dari dua pompa karena akan ada lebih banyak pompa kecil yang beroperasi.

Degradasi yang anggun adalah alternatif untuk menambahkan sistem identik dan paralel yang mahal. Ini memastikan bahwa fitur atau fungsionalitas dari keseluruhan peralatan menurun secara proporsional dengan jumlah komponen yang gagal. Untuk mencapai degradasi terukur seperti itu, pemeriksaan semua kemungkinan kegagalan dalam semua komponen harus dilakukan. Dampaknya terhadap kinerja sistem secara keseluruhan harus dianalisis dan didokumentasikan.

Teknik tersebut memberikan toleransi terhadap kegagalan parsial dan memungkinkan sistem untuk melanjutkan fungsinya pada kapasitas yang menurun.

Redundansi pasif

Redundansi pasif adalah redundansi siaga di mana peralatan alternatif ada – tetapi hanya dapat mengambil alih fungsi yang dimaksudkan jika peralatan utama rusak.

Kita dapat membedakan dua jenis redundansi pasif: 

  1. mengoperasikan redundansi pasif
  2. redundansi pasif non-operasional

Mengoperasikan redundansi pasif adalah peralatan di mana peralatan alternatif hadir sebagai cadangan panas. Peralatan siaga panas karena dapat beroperasi dalam kondisi tanpa beban. Dalam beberapa kasus, mungkin melayani fungsi yang berada di luar definisi fungsi peralatan utama.

Setelah kegagalan peralatan utama, peralatan siaga yang beroperasi dapat secara otomatis dialihkan untuk menjalankan fungsi peralatan utama.

Contoh operasi redundansi pasif dapat berupa alternator sekunder yang beroperasi di bawah kondisi tanpa beban dan memenuhi semua kondisi paralel lainnya seperti tegangan terminal, frekuensi, dan urutan fase yang sama. Setelah kegagalan alternator utama, alternator sekunder dapat secara otomatis disinkronkan dengan sistem dan mengambil alih beban.

Dalam kasus redundansi pasif non-operasional , peralatan siaga dimatikan. Setelah kegagalan peralatan utama, peralatan siaga dapat diatur secara otomatis atau manual ke kondisi operasi dan mengambil alih fungsi peralatan utama.

Sebuah contoh yang baik dari redundansi pasif non-operasional adalah pompa air kota siaga yang dapat dimulai dan dioperasikan secara manual untuk mengalirkan air ke penduduk jika pompa air utama tidak berfungsi. Karena pemulihan operasi tidak kritis, operator dapat pergi dan menyalakan pompa (dan menyinkronkannya dengan sistem nanti, sesuai kebutuhan).

Teknik keandalan untuk menganalisis toleransi kesalahan 

Toleransi kesalahan adalah bagian dari upaya rekayasa keandalan dan memerlukan pemeriksaan yang cermat terhadap semua kemungkinan kegagalan yang dapat terjadi di dalam peralatan. Failure Mode Effect Analysis (FMEA) dan Fault Tree Analysis (FTA) adalah dua teknik yang terkenal untuk menganalisis desain sistem dari pendekatan bottom-up dan top-down.

Untuk lebih memahami toleransi, urutan kegagalan dan ketergantungan harus dianalisis dan diselidiki. Teknik yang sangat berguna untuk menganalisis dependensi dan urutan adalah model Markov di mana probabilitas setiap peristiwa kegagalan akan bergantung pada keadaan peristiwa sebelumnya.

Demikian pula, teknik kuat lainnya adalah simulasi Monte Carlo yang dapat digunakan untuk memodelkan dampak ketidakpastian dari setiap peristiwa kegagalan pada kinerja sistem.

Toleransi kesalahan dan operasi pemeliharaan

Apakah sistem yang toleran terhadap kesalahan membutuhkan lebih sedikit perawatan? Yah, ya dan tidak.

Karena redundansi dan karakteristik lain yang telah kita bahas sebelumnya, sistem seperti itu biasanya dapat mengalami lebih banyak kesalahan sebelum fungsionalitasnya terganggu. Namun, jika masalah tidak ditangani, akumulasi kesalahan pada akhirnya akan menyebabkan kerusakan sistem atau peralatan. Oleh karena itu, tim pemeliharaan harus menggunakan sistem CMMS untuk memastikan tindakan pemeliharaan korektif dilakukan pada waktunya.

Dalam beberapa hal, toleransi kesalahan memberi tim pemeliharaan dan dukungan lebih banyak ruang bernapas. Mereka masih perlu mengatasi masalah, tetapi mungkin tidak segera.

Meskipun desain yang toleran terhadap kesalahan memiliki tantangan dalam hal peningkatan biaya dan kompleksitas, mereka menebusnya dalam bentuk peningkatan keandalan peralatan.


Pemeliharaan dan Perbaikan Peralatan

  1. COVID 19 dan Cloud; COVID 19 dan Dampaknya pada Bisnis
  2. Perawatan dan keandalan berkinerja terbaik
  3. Pemeliharaan dan keandalan - tidak pernah cukup baik
  4. Detail penting dalam pemeliharaan dan keandalan
  5. Pemeliharaan dan Keandalan Pemasok:Waspadalah Pembeli
  6. Manufaktur yang Fleksibel dan Keandalan Dapat Berdampingan
  7. Menerapkan entropi untuk pemeliharaan dan keandalan
  8. UT mengganti nama program menjadi Pusat Keandalan dan Pemeliharaan
  9. Perspektif pembuat kayak tentang keandalan dan keamanan
  10. ISA menerbitkan buku tentang keamanan dan keandalan sistem kontrol