監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

歸檔不同于備份

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

周濤

目前,較普遍的歸檔應(yīng)用只是簡(jiǎn)單地把備份數(shù)據(jù)保存很長(zhǎng)時(shí)間,每周或每月不加選擇地進(jìn)行全數(shù)據(jù)備份,再根據(jù)商業(yè)要求保存幾年甚至幾十年。但是,歸檔與備份有本質(zhì)的不同,因?yàn)闅w檔的數(shù)據(jù)可能幾個(gè)月甚至幾年未被使用,而一旦需要時(shí)則必須盡快獲取。在備份數(shù)據(jù)中尋找特定的信息不僅耗時(shí),而且代價(jià)很高。將備份當(dāng)作歸檔會(huì)帶來(lái)許多問(wèn)題。

備份系統(tǒng)用于歸檔的困境

首先,當(dāng)用戶需要查找?guī)啄昵暗囊恍┫嚓P(guān)資料時(shí),就必須記住這些文件存放在什么地方。這不是一件容易的事,即使用戶能記住,由于計(jì)算機(jī)平臺(tái)和軟件的日新月異,要找到當(dāng)年的讀取設(shè)備、操作系統(tǒng)和應(yīng)用程序,甚至還需要訪問(wèn)權(quán)限去打開(kāi)這些文件是相當(dāng)費(fèi)力的。

其次,用備份數(shù)據(jù)來(lái)滿足電子發(fā)現(xiàn)的要求就更加困難。例如,公司要獲取某個(gè)員工在3年前某兩個(gè)月內(nèi)從Exchange服務(wù)器上發(fā)出的所有電子郵件,或許可以花很長(zhǎng)時(shí)間從備份系統(tǒng)中恢復(fù)特定時(shí)間內(nèi)在Exchange服務(wù)器上保存過(guò)的電子郵件,但如果接收者在收到該員工電子郵件的同一天把它刪除了,那么被刪除的電子郵件就沒(méi)能在當(dāng)晚的備份作業(yè)中保存。因此,嚴(yán)格說(shuō)來(lái),即使找到了所有已備份的電子郵件,也不能符合電子發(fā)現(xiàn)的特定要求。

第三,恢復(fù)備份數(shù)據(jù)并進(jìn)行查找會(huì)消耗大量時(shí)間和費(fèi)用。試想一下,如果要把過(guò)去10年中滿足某些條件的Exchange服務(wù)器上的電子郵件找出來(lái),而公司每星期做一次備份,那么該公司的IT管理員就必須把每個(gè)恢復(fù)到Exchange服務(wù)器中的滿足條件的電子郵件存入一個(gè).pst文件,這樣的手工作業(yè)至少要重復(fù)500多次。

此外,備份系統(tǒng)用于保存歸檔數(shù)據(jù)是相當(dāng)?shù)托У?。一個(gè)歸檔系統(tǒng)對(duì)每個(gè)文件通常保存1~2份拷貝就足夠了,而備份系統(tǒng)卻沒(méi)有這樣的邏輯,特別是全備份系統(tǒng),每次備份總是把未刪除的舊數(shù)據(jù)又保存一次,浪費(fèi)了很多存儲(chǔ)空間。隨著備份格式和磁帶介質(zhì)更新?lián)Q代,許多企業(yè)耗費(fèi)了相當(dāng)大的精力進(jìn)行設(shè)備升級(jí)和數(shù)據(jù)拷貝、遷移以及各種轉(zhuǎn)換,同時(shí)又保留舊的備份格式和舊磁帶上的數(shù)據(jù),導(dǎo)致不同格式數(shù)據(jù)的許多副本分散在不同的設(shè)備和介質(zhì)中,對(duì)這些數(shù)據(jù)進(jìn)行有效管理和查詢幾乎不可能。

有效歸檔系統(tǒng)的特征

一個(gè)有效的歸檔系統(tǒng)最重要的特征是包含了足夠多的元數(shù)據(jù),并能通過(guò)邏輯方式獲取信息。例如,一個(gè)電子郵件歸檔系統(tǒng)的元數(shù)據(jù)應(yīng)至少包括發(fā)件人、收件人、主題、時(shí)間等信息,通常還會(huì)把電子郵件主體放入數(shù)據(jù)庫(kù)用于全文搜索,甚至把附件的相關(guān)信息和關(guān)鍵詞也提取出來(lái)作為元數(shù)據(jù)保存。

歸檔系統(tǒng)的另一個(gè)重要特征是能夠保存預(yù)定數(shù)量的副本。例如,一個(gè)公司可以決定把一份歸檔數(shù)據(jù)存放在磁盤(pán)介質(zhì)的存儲(chǔ)設(shè)備中,把另一份相同的數(shù)據(jù)存放在光盤(pán)或磁帶庫(kù)里,以確保數(shù)據(jù)萬(wàn)無(wú)一失。

兩類(lèi)主要的歸檔系統(tǒng)

根據(jù)保存數(shù)據(jù)方式的不同,歸檔系統(tǒng)大致可分為兩類(lèi)。

一類(lèi)是傳統(tǒng)的依附于備份軟件的歸檔系統(tǒng),允許用戶對(duì)所選擇的文件進(jìn)行歸檔,并把有限的元數(shù)據(jù)附加上去,然后把這些歸檔數(shù)據(jù)的備份文件刪除,以減少重復(fù)數(shù)據(jù)。這種歸檔的缺陷在于,如果用戶想通過(guò)不同的元數(shù)據(jù)查找歸檔信息,就必須建立幾個(gè)附加不同元數(shù)據(jù)的歸檔文件。因此,這類(lèi)系統(tǒng)基本上只適用于訪問(wèn)率較低的歸檔數(shù)據(jù)。

第二類(lèi)歸檔系統(tǒng)意識(shí)到任何歸檔數(shù)據(jù)可能有不同的用途,因此需要用不同的元數(shù)據(jù)來(lái)描述。實(shí)現(xiàn)這類(lèi)系統(tǒng)的關(guān)鍵在于對(duì)實(shí)際的歸檔數(shù)據(jù)只保存一份,而把所有的元數(shù)據(jù)都保存在可搜索的數(shù)據(jù)庫(kù)中。這就是近年來(lái)逐漸興起的內(nèi)容尋址存儲(chǔ)(CAS)。與第一類(lèi)只在備份后才成為歸檔數(shù)據(jù)的歸檔系統(tǒng)不同,CAS歸檔系統(tǒng)對(duì)所有的數(shù)據(jù)都自動(dòng)不間斷地進(jìn)行歸檔。一個(gè)文件或電子郵件一經(jīng)產(chǎn)生,其中一個(gè)拷貝以及相關(guān)的元數(shù)據(jù)就被保存到歸檔系統(tǒng)中去。

CAS歸檔的另一個(gè)優(yōu)勢(shì)在于,使用了單一實(shí)例和增量保存的手段。它對(duì)所有的文件或電子郵件都只保存一個(gè)拷貝,當(dāng)該文件或電子郵件被修改后再次發(fā)送和保存時(shí),歸檔系統(tǒng)能夠只保存變化的字節(jié),因而極大地節(jié)省了磁盤(pán)空間,簡(jiǎn)化了管理。這種特性使CAS歸檔系統(tǒng)頻繁地出現(xiàn)在分級(jí)存儲(chǔ)管理和重復(fù)數(shù)據(jù)刪除應(yīng)用中。

CAS歸檔系統(tǒng)

國(guó)外主要的存儲(chǔ)廠商如EMC和HP,以及一些初創(chuàng)企業(yè)如Bycast和Permabit等都相繼推出了CAS歸檔產(chǎn)品。這些產(chǎn)品雖然技術(shù)路線相近,但各自的特點(diǎn)和針對(duì)的應(yīng)用不盡相同。比如,HP RISS系統(tǒng)主要用于電子出件歸檔,而B(niǎo)ycast的方案局限于醫(yī)療影像的歸檔。國(guó)內(nèi)歸檔市場(chǎng)才剛剛起步,也出現(xiàn)了一些歸檔產(chǎn)品。谷數(shù)科技的D-Mesh集群CAS系統(tǒng)可以滿足多種歸檔的應(yīng)用需求,其最顯著的特點(diǎn)是內(nèi)嵌了非結(jié)構(gòu)化搜索引擎,極大地提高了元數(shù)據(jù)生成、管理和數(shù)據(jù)查找的效率,把歸檔技術(shù)推向一個(gè)新的高度。

來(lái)源:CIO時(shí)代

發(fā)布:2007-03-25 10:59    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章:
南昌OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢