Manufaktur industri
Industri Internet of Things | bahan industri | Pemeliharaan dan Perbaikan Peralatan | Pemrograman industri |
home  MfgRobots >> Manufaktur industri >  >> Industrial Internet of Things >> Komputasi awan

Cloud Outage:Mengapa dan Bagaimana Terjadinya?

Semakin TI bergantung pada layanan cloud, semakin besar kemungkinan Anda mengalami downtime dan kehilangan pendapatan karena pemadaman cloud. Lebih dari 60% organisasi yang menggunakan cloud publik melaporkan kerugian pada tahun 2022 karena insiden ini, jadi pemadaman bukanlah kejadian aneh yang kemungkinan besar akan dihadapi perusahaan.

Tetapi apakah pemadaman cukup menjadi alasan untuk meninggalkan cloud untuk selamanya? Atau haruskah Anda tetap menggunakan jenis infrastruktur ini meskipun terkadang ada risiko downtime?

Artikel ini membahas semua yang perlu Anda ketahui tentang pemadaman awan . Kami menguraikan penyebab utamanya, memeriksa statistik yang membuka mata, menunjukkan cara meminimalkan dampak waktu henti cloud, dan melihat pemadaman paling berdampak yang terjadi dalam beberapa tahun terakhir.

Apa Itu Pemadaman Awan?

Pemadaman cloud adalah rentang waktu di mana layanan penyedia cloud tidak tersedia untuk pengguna akhir. Infrastruktur vendor turun (karena bug, kegagalan daya, dll.), dan klien kehilangan akses ke aset berbasis cloud hingga penyedia memperbaiki masalahnya.

Dari segi dampak, tidak ada perbedaan antara pusat data di tempat yang down dan pemadaman cloud. Anda kehilangan akses ke aset TI dalam kedua kasus tersebut, tetapi pendekatan langsung ke komputasi awan menambahkan beberapa pertimbangan unik:

Seperti halnya perangkat keras lokal, ada dua jenis pemadaman listrik:

Studi terbaru mengungkapkan bahwa pemadaman yang tidak direncanakan menghabiskan biaya 35% lebih banyak daripada waktu henti yang direncanakan (baik di tempat maupun di cloud). Perbedaan harga terjadi karena insiden tak terduga membutuhkan waktu lebih lama untuk diidentifikasi dan diperbaiki—dan semakin lama pemadaman berlangsung, semakin besar kerusakannya.

Dibandingkan dengan perangkat keras di lokasi, infrastruktur berbasis cloud menghasilkan waktu henti yang lebih sering tetapi dengan tingkat keparahan yang lebih rendah . Karena tidak ada sistem hosting yang menyediakan waktu aktif 100%, klien siap untuk mentolerir pemadaman sesekali sebagai imbalan atas keuntungan komputasi awan. Kesediaan ini juga terlihat dalam pertumbuhan pasar—cloud akan menghasilkan 14,2% dari total pengeluaran TI global pada tahun 2024 (naik dari 9,1% pada tahun 2020).

Penyebab Pemadaman Cloud

Pemadaman cloud diakibatkan oleh sejumlah penyebab baik di dalam maupun di luar kendali penyedia. Berikut daftar yang paling umum:

Apa Yang Terjadi Saat Cloud Turun?

Dalam skenario kasus terbaik, pemadaman cloud hanya berlangsung beberapa menit dan memengaruhi sejumlah kecil pengguna atau layanan. Dalam kasus terburuk, pemadaman melumpuhkan bisnis klien selama setengah hari atau lebih. Sebuah perusahaan kehilangan akses ke semua aset berbasis cloud dan tetap terputus sampai pemadaman berakhir.

Meskipun mengancam, kesalahan oleh penyedia pihak ketiga adalah penyebab "hanya" 7% dari pemadaman parah pada tahun 2021 . Pemadaman parah harus melibatkan satu (atau beberapa) hal berikut:

Meskipun ada masalah yang lebih mendesak (seperti yang ditunjukkan pada bagan donat di bawah), ingatlah bahwa rata-rata satu menit waktu henti berharga $5.600 (Angka per menit ini mencapai $9.000 untuk perusahaan). Jika Anda tidak siap (yaitu, Anda tidak memiliki cadangan data, pemulihan bencana, dll.), pemadaman cloud dapat menghentikan layanan Anda dan menyebabkan kerugian besar.

Perusahaan yang menyimpan segmen kecil operasi di cloud kurang rentan terhadap pemadaman. Misalnya, jika Anda hanya meng-host email di cloud, bahkan pemadaman selama satu hari bukanlah bencana besar. Anda dapat menunggu insiden atau menjalankan aplikasi dengan fungsionalitas yang dikurangi, strategi yang tidak berfungsi jika Anda menggunakan cloud untuk menjalankan platform IoT atau melakukan pemrosesan pembayaran.

Dalam beberapa kasus, pemadaman cloud menyebabkan kehilangan data permanen (jumlah data yang hilang tergantung pada frekuensi pencadangan). Selain itu, klien di industri yang ketat bertanggung jawab atas denda hukum jika pemadaman menyebabkan pelanggaran atau kebocoran data, jadi berhati-hatilah saat memutuskan apa yang Anda simpan di penyimpanan cloud.

Apa yang Dapat Dilakukan Pengguna?

Berikut yang dilakukan perusahaan untuk mengurangi dampak pemadaman cloud:

Penonaktifan Cloud Terbesar Baru-baru ini

Pemadaman cloud tidak dapat dihindari saat menggunakan cloud, dan bahkan penyedia paling populer (seperti Azure, AWS, dan Google Cloud) tidak kebal terhadap waktu henti. Mari kita lihat beberapa pemadaman cloud paling signifikan dalam sejarah baru-baru ini.

Azure Outage (Oktober 2021)

Pada Oktober 2021, Microsoft Azure mengalami gangguan yang menghentikan layanan mesin virtual selama enam jam . Selama pemadaman berlangsung, banyak pengguna tidak dapat menerapkan VM baru atau memperbarui ekstensi. Operasi manajemen layanan dasar (seperti memulai, membuat, dan menghapus) juga menyebabkan kesalahan.

Penyebab pemadaman cloud adalah ketidakmampuan kueri VM untuk mengambil data versi artefak yang diperlukan. Laporan pasca-pemulihan mengungkapkan bahwa kesalahan berbasis perangkat lunak terjadi saat Microsoft memigrasikan salah satu arsitektur VM-nya.

Google Cloud Outage (November 2021)

Google Cloud mati selama sekitar dua jam pada pertengahan November tahun lalu, memengaruhi hal-hal seperti:

Situs web yang terkena dampak menampilkan 404 kesalahan saat pengunjung mencoba mengaksesnya. Google melaporkan bahwa penyebab pemadaman cloud adalah kesalahan dalam konfigurasi jaringan yang bertanggung jawab untuk penyeimbangan muatan.

AWS padam (Desember 2021)

Lonjakan aktivitas koneksi yang besar membuat perangkat jaringan kewalahan di salah satu fasilitas unggulan AWS, memengaruhi berbagai situs web dan aplikasi. Beberapa "korban" yang paling menonjol adalah:

Masalah pusat data menyebabkan latensi yang parah dalam jaringan AWS internal. Aplikasi pelanggan merasakan efek riak, mengalami penundaan lalu lintas atau penghentian total selama sekitar tujuh jam .

Dua Pemadaman IBM Selanjutnya (Januari 2022)

Masalah dengan infrastruktur IBM memengaruhi layanan cloud di wilayah Dallas selama lebih dari lima jam . Tim internal menyelesaikan masalah tetapi secara tidak sengaja menyebabkan masalah tambahan selama satu jam dengan cloud pribadi virtual. Masalah sekunder memengaruhi pengguna di seluruh dunia, termasuk AS, Jepang, Kanada, dan Jerman.

AWS/Slack Outage (Februari 2022)

Slack mengalami pemadaman sumber daya cloud AWS pada bulan Februari yang mencegah penggunaan normal platform komunikasi selama lima jam . Lebih dari 11.000 pengguna yang dilaporkan tidak dapat:

Tim Slack tidak pernah membagikan alasan di balik pemadaman cloud dan meminta semua pengguna yang terpengaruh untuk memulai ulang aplikasi dan menghapus cache mereka setelah pemulihan.

iCloud Outage (Maret 2022)

Lima belas layanan utama Apple terhenti selama empat jam pada bulan Maret karena pemadaman awan, termasuk:

Sistem korporat dan ritel Apple juga turun. Perusahaan kemudian mengungkapkan bahwa akar masalahnya adalah masalah yang terkait dengan sistem nama domain (DNS) perusahaan.

Google Cloud Outage (Maret 2022)

Pada 8 Maret 2022, pengguna Google Cloud mengalami error layanan selama dua setengah jam . Spotify dan Discord termasuk di antara yang terkena pemadaman.

Perubahan pada kode Direktur Lalu Lintas untuk memproses konfigurasi menyebabkan kesalahan. Menurut laporan pasca-pemulihan, perubahan kode yang buruk mengabaikan migrasi format data konfigurasi, sehingga platform secara tidak sengaja menghapus pemrograman pengguna.

Atlassian Outage (April 2022)

Pemadaman Atlassian terbesar tahun ini dimulai pada 5 April dan berakhir pada 18 April (meskipun beberapa pengguna mulai memulihkan layanan pada 8 April). Perusahaan menjelaskan bahwa pemadaman terjadi karena komunikasi tim yang tidak memadai dan rencana respons insiden yang tidak direncanakan dengan baik.

Meskipun pemadaman awan ini berlangsung hampir dua minggu untuk beberapa pengguna, tidak ada laporan kehilangan data klien yang signifikan. Namun, pengguna dari kedua produk unggulan Atlassian, Trello dan Jira, terpengaruh oleh masalah ini.

Penghentian Microsoft Azure (Juni 2022)

Pada tanggal 7 Juni, pelanggan Azure tidak dapat terhubung ke sumber daya yang dihosting di wilayah AS Timur 2 (terutama Virginia). Pemadaman berlangsung sekitar dua belas jam dan tidak mempengaruhi konsumen yang mengandalkan infrastruktur zona-redundan. Layanan yang dikompromikan termasuk:

Penyebabnya adalah osilasi listrik tiba-tiba di salah satu pusat data lokal, yang menyebabkan Unit Penanganan Udara (AHU) mati.

Penutupan Cloudflare (Juni 2022)

Pada bulan Juni, pemadaman yang tidak disengaja di Cloudflare menyebabkan gangguan besar yang berlangsung satu setengah jam , menghapus situs populer seperti:

Vendor yang berbasis di San Francisco tersebut menjelaskan bahwa waktu henti yang tidak direncanakan tersebut diakibatkan oleh perubahan konfigurasi jaringan di 19 pusat datanya.

Jangan Mengabaikan Nilai dari Cloud Outage Planning

Contoh pemadaman cloud dalam beberapa tahun terakhir mengirimkan pesan yang jelas:meskipun cloud adalah pengubah permainan TI, teknologinya tidak mudah . Perusahaan yang peduli dengan pengguna akhir dan ketersediaan aplikasi harus siap menghadapi waktu henti sesekali, yang menjadikan pencadangan dan pemulihan bencana (BDR) sebagai bagian integral dari penggunaan sumber daya berbasis cloud.


Komputasi awan

  1. Apa Itu Transfer Moulding dan Bagaimana Cara Kerjanya?
  2. Bagaimana (dan Mengapa) Membandingkan Kinerja Cloud Publik Anda
  3. Apa itu Keamanan Cloud dan Mengapa Diperlukan?
  4. Cloud dan Bagaimana Mengubah Dunia TI
  5. Arsitektur Berbasis Agen Vs Agen:Mengapa Penting?
  6. Apa Itu Server Vpn yang Dikaburkan dan Bagaimana Cara Kerjanya
  7. Bagaimana Cara Kerja Google Cloud Storage?
  8. Mengapa dan Bagaimana Melakukan Audit Vakum
  9. Apa itu Kopling Industri dan Bagaimana Cara Kerjanya?
  10. Pemeriksaan Derek:Kapan, Mengapa, dan Bagaimana?