伯恩茅斯艺术大学好吗:

教程

螞蟻金服解釋 支付寶大面積癱瘓 未獲業界認同

發布時間:2015-05-28 10:07:01    來源:網購服務平臺    點擊:304

對于螞蟻金服和阿里巴巴來說,2015年5月27日絕對是值得記住的一天,就在銀監會網站于當日下午發布關于浙江網商銀行的開業批復的同時,付寶的系統在下午5點左右出現了故障,這導致全國部分用戶支付寶錢包的功能無法使用,出現了“網絡繁忙、請稍后再試”的提示語。

對此,支付寶錢包官方微博在當天晚間6:05解釋稱,此次事故的是“由于杭州市蕭山區某地光纖被挖斷”而“造成目前少部分用戶無法使用支付寶”,支付寶表示,運營商正在搶修,而支付寶的工程師正在緊急將用戶請求切換至其他機房。支付寶還稱,用戶的資金安全并不會因此而受到影響,而交易數據不同步的情況也會在修復后恢復同步。

從下午5時許到晚間7時左右,系統的故障在持續了兩個小時左右后被排除。擁有超過4萬億年交易總額的支付寶是中國第一大第三方交易平臺,約占中國整體社會消費金額的六分之一。由于支付寶的在金融領域的系統重要性程度,以及其獨特的基于云計算的IT技術架構,此次故障受到各方關注。

對于導致此次事件的原因,螞蟻金服方面的解釋并未獲得金融和互聯網界的廣泛認同。業界聚焦于這樣一個問題,如果按金融機構系統災備標準衡量的話,即使在出現光纜被挖斷的情形,系統的運行也應該正常無誤。

一位資深電信領域專家表示,現在網絡架構多中心制決定了,任何一個節點出現問題,它的任務將由其他中心來承接。而支付寶肯定是多節點多中心制。任何一點斷服,都會由其他節點來進行服務。而且支付寶的路由非常多,其系統也不可能只接一家運營商,即便是只接一家,肯定也是多路由接入。

另一位傳統金融機構的系統安全領域專家稱,從理論上講,支付寶應該全部是互聯網出口,也就是說,所有的入口和出口都是基于互聯網通信或者電信的節點來實現數據的交換和通信,關鍵節點出現斷電或者光纖挖斷的情況,理論上應該有備份的接口,就相當于可以放棄出現故障的線路,通過其他的專線可以繼續保證運行。他因此推斷斷的電纜應該是離主機房比較近的一根線。

簡而言之,在光纜被挖的情況下,整個系統的切換應該可以更加順暢。

在我國金融領域,金融機構涉及客戶資金的重要系統都有災備系統。比如,目前國有大型銀行基本上是采用“兩地三中心”的模式,即同城除了有一個災備中心以外,異地也有一個災備中心,這樣就可以應對戰爭、重大災難等極端情形。因此,當一個機房出問題時,系統會切到同城或者異地的災備中心。

湯森路透的金融網絡網絡號稱世界最大的,它處理著全球實時的金融數據,其系統的建設要求就是在自然災害或戰爭的時候也不能宕機,兩條不同電信公司的光纜和不同電力公司的電纜分別從機房的兩個方向浸入,同一個機房的所有系統實時雙備份,并建立異地(巴黎、日內瓦)機房同時實時處理相同的數據。

一位國有大型銀行的專業人士分析,通常來說,如果是同城災備,客戶根本感受不到延遲,如果是異地,系統的切換也會在較短的時間內完成。但無論同城還是異地,兩個小時的系統切換的時間對于支付寶這樣一個金融支付系統來說顯然太長。

這一說法得到多位接受《財經》記者采訪的電信技術人士的支持。國電信的一位技術高層人士分析,服務故障切換機制應該是自動的,根據一定的事先設置的策略,無需人為干預,人工可以在服務切換后,再重新定義流量疏導方式。

一位螞蟻金服的高管解釋了切換時間較長的原因。他表示,大流量網站實時切換涉及資金時有難度。切換時的數據要確保不丟不錯,所以放緩速度是為了安全,對此,他們也在內部討論這個選擇的利弊,但認為,首先要保證客戶資金安全,當然未來仍有優化空間。在這次恢復中,支付寶已發現了可以更快恢復的一些環節,未來出現類似情況有把握更快且更安全的恢復。

而某大型國企網絡運維人員則認為,從技術角度看,支付寶此次事故可能是內部應用??槌雋宋侍?,未經嚴格驗證的應用被統一升級后,被意外觸發到未知狀態,導致出現此類問題。

上述運維人員還表示,經他觀察,支付寶DBA(數據管理人員)緊急恢復了RPO=10days的完整數據(RPO,Recovery Point Objective,復原點目標,是指當服務恢復后,恢復得來的數據所對應時間點,理想的狀態是RPO=0,故障出現立即恢復,但需要極大投入),并不停地進行分段增量數據恢復,歷時約2小時余,這就是應用??櫚奈侍?。

上述中國電信技術人士則分析認為,出現這種問題的可能性是,支付寶多個數據中心之間的自動流量切換機制出現問題,只能人工介入?;箍贍蓯瞧淥衷潁閡皇嗆苡鋅贍蓯侵Ц侗υ獾攪斯セ?;二是支付寶的路由配置癱瘓了;三是支付寶的云服務器癱瘓了,亞馬遜也出現過這個問題。號稱最先進最安全的阿里云系統對自家業務并沒支撐好。

就以上相關問題,《財經》記者詢問了螞蟻金服方面,螞蟻金服回應稱,具體的技術分析正在加緊進行,但得出結論判斷還需要一段時間。

微妙的是,在螞蟻金服更早的一份媒體回應中稱,之所以花費較長時間,是在流量向支付寶位于深圳的數據中心遷移的時候,切換系統也受到了光纖斷裂的影響,所以切換上花費了一些時間。這與“技術上他們可以做到更快恢復,之所以較慢是為了確保不丟數據”這一說法并不一致。

金融領域的系統安全一直是監管機構的重點。2013年6月,工行在系統升級的時候也曾出現全國大面積癱瘓的情況,根據當時媒體的報道,全國多地用戶在登陸網銀系統時均出現了“登陸失敗,因系統原因暫無法獲取當前交易結果”的提示,但是整個問題在1-2個小時內處理掉了,其系統的回退也很快。即便如此,這次事故也被監管機構當成案例來反復“敲打”各家銀行重視系統安全。

隨時逛 及時返

周一至周日9:00-22:00

                                                                

      Copyright ?2008-2017  粵ICP備12050417號   廣州市峻捷計算機科技有限公司  伯恩茅斯富勒姆 伯恩茅斯富勒姆 www.rwyvvz.com.cn  返利快-返利高-支付快