監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關閉

[原創(chuàng)]數(shù)據(jù)通訊故障拷問IT服務應急方案

申請免費試用、咨詢電話:400-8352-114

ewaysun

昨天公網(wǎng)的服務器硬盤出現(xiàn)故障,邏輯卷Offline導致客戶的數(shù)據(jù)通訊無法操作。

7:00 服務臺一上班就開始接到客戶的報修電話,在其后的時間里服務臺電話鈴聲此起彼伏,仿佛令人置身于戰(zhàn)時指揮部。話務員忙的都無暇他顧;

8:20 運維部的主管將此問題通知到負責服務器維護的主管;

8:30 服務器維護人員遠程維護無效;

8:45 維護人員到達現(xiàn)場處理,發(fā)現(xiàn)硬盤故障無法運行。采用的是更換備份機的方式;

10:30 解決服務器故障;

13:30 發(fā)現(xiàn)數(shù)據(jù)通訊之后存在1月9日的配送信息。問題管理開始著手解決此項問題;

14:00 客戶的報修明顯減少。

從7:00至14:00故障的解決持續(xù)了7個小時。全市3000多家客戶因為此次的硬盤故障問題都無法進行數(shù)據(jù)通訊。

幸運的是我們沒有這方面的考核,否則不知道會不會因為這個故障和處理的時間而影響到年底的服務考評。

事件得到控制,雖然不能說是及時,但也沒造成嚴重后果?;仡欉@次意外,聽到最多的是:這次硬盤故障無法預料。技術上的無法預測在所難免,但換個角度想:凡事沒有無因之果。和維護人員聊了之后,他也說了幾個可能導致此次故障的因素: 

  1. 大量頻繁的讀寫操作導致磁盤當機
  2. 磁盤本身的問題
  3. 系統(tǒng)本身的問題
  4. 機房的環(huán)境

且不論技術方面的細節(jié),從這些因素看出根據(jù)故障產(chǎn)生的原因進行識別和控制才是IT服務人員應該具備的態(tài)度。而不是習慣性地認為這些問題根本沒法預測或者提前發(fā)現(xiàn)。雖然也不能完全通過控制故障原因來達到控制故障的目的,但是至少我們可以通過多方面的控制降低故障發(fā)生的幾率。

故障發(fā)生了,而且很緊急。從管理上應該啟動應急方案,這是管理保障。也許在此需要再延伸一下對應急方案的思考。方案有了還不夠,一定要演練!愈是責任大的應急方案,愈是要演練。對維護人員形成一個處理的條件反射,防止突發(fā)事件發(fā)生時緊張帶來的手足無措。

最近我們內(nèi)部也搞一個留單超標的應急方案,自從審批通過之后,就束之高閣??磥硪残枰贸鰜磉m當?shù)?ldquo;曬曬太陽了”。

 

發(fā)布:2007-03-25 10:06    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
相關文章:
長沙OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢