亞馬遜當機修好了!卻揭露「壟斷1市場」危機…為何一故障就讓全球網路癱瘓?
亞馬遜雲端運算服務AWS昨日無預警故障。圖/翻攝自FB/Amazon Web Services

亞馬遜當機修好了!卻揭露「壟斷1市場」危機…為何一故障就讓全球網路癱瘓?

mirror-daily-logo

2025/10/21 10:18:00

編輯:

古靜兒

亞馬遜旗下的雲端運算服務「Amazon Web Services」(AWS)昨(20)日發生重大故障,導致全球大範圍網路服務中斷,從銀行、外送平台、通訊應用程式到遊戲伺服器,超過1000家企業與上億名使用者受到波及,這也是自去(2024)年「CrowdStrike」導致全球網路大當機之後,規模最大的一次網路中斷事件。雖然目前故障已修復完畢,但也引起各界探討AWS是否存在結構性脆弱的隱憂。

波及全球數百萬人,亞馬遜雲端AWS為什麼會故障?

根據BBC、CNN等外媒報導,AWS位於美國維吉尼亞北部的資料中心昨日突然發生異常,亞馬遜初步確認,事故主因是「網域名稱系統」(Domain Name System,DNS)出現錯誤,該系統負責將網域名稱轉換為IP位址,一旦失效,就會導致各平台之間的連線請求無法被正確導向,即應用程式與網站依舊存在,只是網路流量卻找不到正確的目的地,造成全球網路服務陷入癱瘓。
AWS指出,這次網路中斷的肇因,是負責在多台伺服器之間分配流量與監測運作狀態的「網路負載平衡器底層健康監測子系統」(Health Monitoring Subsystem)出現問題,當監測系統失效、流量分配錯亂,就會導致DNS解析發生異常,進而影響旗下存放企業資訊、客戶資料的雲端資料庫DynamoDB的API位址連線,讓企業「找不到所需的資料」。
網站監測平台「Downdetector」與「Ookla」即時監測資料顯示,超過400萬名網路用戶通報大當機問題,受波及的服務包括Snapchat、Reddit、Canva、Zoom、Amazon購物網站、Prime Video,以及各大銀行線上服務等,線上支付方式全都停擺。另外,受AWS託管影響的線上遊戲 《要塞英雄(Fortnite)》 、部落衝突《Clash of Clans》也無法登入。
20251020亞馬遜Amazon。圖/東方IC
亞馬遜Amazon。圖/東方IC

AWS修好了,但網路中斷不是第一次?

針對這次網路中斷時間,亞馬遜在台灣時間今(21)日清晨6時宣布,所有AWS服務都已恢復正常運作,但仍有部分服務出現「訊息積壓」(message backlog),預計需要數小時才能完全清除。亞馬遜建議企業客戶「清除快取」(cache)以加快恢復速度,並強調資料安全未受影響,公司預計在未來幾天內進行「事後技術檢討」,屆時將對外公布詳細的故障成因與修復機制。
值得注意的是,這已經是AWS在短短5年內第3次因維吉尼亞北部資料中心出現重大事故,過去在2020年、2021年的2次中斷同樣造成多家網站癱瘓,當時亞馬遜就已承諾強化該資料中心的容錯與修改冗餘設計,沒想到如今再度發生網路中斷事件,也引發專家質疑,該資料中心系統負載過重的問題始終沒有完全解決。
康乃爾大學電腦科學教授伯曼(Ken Birman)指出,AWS其實提供多重備援方案,讓開發者能在某一資料中心出現問題時啟動自我防護機制,或建立與其他雲端供應商的備援:「當企業為了節省成本、加快上線而偷工減料,最後忘記了最重要的那一步,就是防止服務中斷,那些公司應該在事後被嚴格檢視。」

不想把雞蛋放在同個籃子,卻很難找到好籃子?

多位網路安全與學界專家一致認為,此次事件再次凸顯出全球網際網路對少數雲端供應商的高度依賴與集中風險。資安公司「NymVPN」的首席數位長賈丁(Rob Jardin)也直言,網際網路原本設計是「去中心化」,但如今大多數線上服務卻集中在幾個雲端巨頭手中,一旦其中某個區域出現問題,影響雄就會迅速擴散。
雖然專家都指出「把所有雞蛋放在同一個籃子裡」的風險,但關鍵在於目前全球雲端市場幾乎由3家美國企業壟斷,除了這次出事的Amazon AWS,另2間則是Microsoft的Azure,以及Google的Cloud Platform;此外還有IBM、阿里巴巴,以及德國零售集團Lidl母公司推出的歐洲雲端平台 Stackit。
不過,可以達到AWS如此龐大規模的替代方案並不多,因此在市場佔有率上,AWS仍然遙遙領先。雖然有部分歐洲政府官員與專家呼籲,歐盟與英國應建立本地雲端基礎設施,以降低對美國企業的依賴,但也有業內人士認為,要建出一個能與AWS對抗的系統,恐怕已經太遲。

延伸閱讀