監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉

企業(yè)數(shù)據(jù)倉庫中元數(shù)據(jù)的應(yīng)用研究

申請免費(fèi)試用、咨詢電話:400-8352-114

文章來源:泛普軟件

0 引 言

以數(shù)據(jù)倉庫為核心的商務(wù)智能(BI)技術(shù)日益受到業(yè)界重視,許多BI系統(tǒng)己經(jīng)投入使用,帶來了巨大的效益。但是數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量問題已經(jīng)嚴(yán)重影響了商務(wù)智能的應(yīng)用能力,由此引發(fā)了人們對元數(shù)據(jù)管理和應(yīng)用的研究。

元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”,即關(guān)于數(shù)據(jù)的內(nèi)容、質(zhì)量、狀況和其他特性的信息。

1 數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量問題

基礎(chǔ)數(shù)據(jù)的正確性、真實(shí)性直接影響到報表和分析結(jié)果的可信度。突出的數(shù)據(jù)質(zhì)量問題包括:

● 數(shù)據(jù)被錯誤理解

● 重要的事實(shí)錯誤傳達(dá)

● 不能判斷商業(yè)變化造成的影響

● 缺乏工具連貫性

● 缺乏查帳索引

數(shù)據(jù)質(zhì)量問題主要是由分公司本身錄入、業(yè)務(wù)系統(tǒng)新舊多次切換和升級、業(yè)務(wù)擴(kuò)展操作等原因造成。

從圖1數(shù)據(jù)質(zhì)量管理體系架構(gòu)圖我們可以看到:元數(shù)據(jù)是數(shù)據(jù)質(zhì)量管理實(shí)現(xiàn)的基礎(chǔ),元數(shù)據(jù)管理支撐功能的實(shí)施是數(shù)據(jù)質(zhì)量管理系統(tǒng)的核心。

圖1 數(shù)據(jù)質(zhì)量管理體系架構(gòu)圖

數(shù)據(jù)質(zhì)量管理系統(tǒng)的核心是元數(shù)據(jù)管理支撐功能的實(shí)施:

● 數(shù)據(jù)質(zhì)量管理包含元數(shù)據(jù)管理

● 元數(shù)據(jù)管理功能為數(shù)據(jù)質(zhì)量管理提供支撐

元數(shù)據(jù)是數(shù)據(jù)質(zhì)量管理系統(tǒng)實(shí)現(xiàn)的基礎(chǔ),是描述和控制BI系統(tǒng)中數(shù)據(jù)的數(shù)據(jù),對上層功能提供信息支撐。

2 應(yīng)用元數(shù)據(jù)提高數(shù)據(jù)質(zhì)量的應(yīng)用實(shí)例

可以提高數(shù)據(jù)質(zhì)量的主要元數(shù)據(jù)業(yè)務(wù)應(yīng)用包括:元數(shù)據(jù)瀏覽、數(shù)據(jù)時效性探察、指標(biāo)管理與分析、數(shù)據(jù)血統(tǒng)分析、影響分析、處理過程分析、表重要程度分析和表無關(guān)程度分析等。

2.1 數(shù)據(jù)血緣分析

輔助管理人員對由BI系統(tǒng)提供的報表、指標(biāo)的數(shù)據(jù)項(xiàng)進(jìn)行血緣分析,了解該指標(biāo)或報表元素由源系統(tǒng)到BI系統(tǒng),由數(shù)據(jù)倉庫到前端顯示或者報表系統(tǒng)的計算過程和處理方法,管理人員可以通過血緣分析結(jié)合數(shù)據(jù)時效性探查來了解提供報表和指標(biāo)的可信度或?qū)PIC的相應(yīng)的指標(biāo)定義和有關(guān)規(guī)范進(jìn)行核查。

業(yè)務(wù)人員可以對由BI系統(tǒng)產(chǎn)生的某一個指標(biāo)或者報表元素進(jìn)行血源分析,即已知某一數(shù)據(jù)項(xiàng),查找到該數(shù)據(jù)項(xiàng)從源系統(tǒng)到前端展示的若干ETL過程相關(guān)的數(shù)據(jù)項(xiàng)、計算方法、計算公式,形成該報表元素(或指標(biāo))的族譜圖,從而了解產(chǎn)生該數(shù)據(jù)項(xiàng)的流程。

2.2 處理過程分析

處理過程分析與數(shù)據(jù)血緣分析類似,但處理過程分析給出的是過程的執(zhí)行相關(guān)信息,數(shù)據(jù)血緣分析給出的是數(shù)據(jù)的流動信息。

2.2.1 影響分析

影響分析使你可以回答類似下面的一些問題:

● 我所做的這個改動還會影響到別的什么地方?

● 這個對象還依賴于別的什么對象?

圖2展示了在金融業(yè)務(wù)BI應(yīng)用中用MetaStage進(jìn)行交叉工具對數(shù)據(jù)質(zhì)量影響的分析,我們可以清晰地通過元數(shù)據(jù)管理工具分析出—個數(shù)據(jù)對象在數(shù)據(jù)處理鏈條上的所有依賴關(guān)系。

圖2 MetaStage交叉工具影響分析示例

2.3 數(shù)據(jù)時效性探察

BI系統(tǒng)中的數(shù)據(jù)時效性是BI系統(tǒng)中數(shù)據(jù)質(zhì)量的重要的組成部分,通過對BI系統(tǒng)元數(shù)據(jù)的管理,可以分析到某一條或某一些數(shù)據(jù)的時效性。首先通過元數(shù)據(jù)瀏覽和檢索功能,檢索感興趣某個數(shù)據(jù)項(xiàng)相關(guān)的元數(shù)據(jù)信息,探察該數(shù)據(jù)最后計算的時間;然后,通過元數(shù)據(jù)ETL分析,找到該元素以及和該元素相關(guān)的計算元素的ETL過程(從生產(chǎn)系統(tǒng)到數(shù)據(jù)倉庫,再從數(shù)據(jù)倉庫到前端展示系統(tǒng))的最終執(zhí)行時間。對上述時間進(jìn)行探查分析,以決定該數(shù)據(jù)的時間有效性和真實(shí)性。

2.4 元數(shù)據(jù)相關(guān)性分析

在調(diào)整BI系統(tǒng)時,經(jīng)常遇到調(diào)整一些系統(tǒng)而影響其他系統(tǒng)的情況。為了保證數(shù)據(jù)的一致性,需要對整個BI系統(tǒng)中的相關(guān)的元數(shù)據(jù)進(jìn)行調(diào)整。此時,通過元數(shù)據(jù)相關(guān)性分析,找到所有需要進(jìn)行調(diào)整的元數(shù)據(jù),可以統(tǒng)一進(jìn)行修改和調(diào)整。

3 結(jié)束語

元數(shù)據(jù)管理是提高數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的必由之路,元數(shù)據(jù)管理的復(fù)雜性及元數(shù)據(jù)管理的很多內(nèi)容仍然需要依靠管理制度、流程、其它輔助工具以及人工參與來共同完成。

發(fā)布:2007-04-21 11:21    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
南昌OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢

泛普南昌OA行業(yè)資訊其他應(yīng)用

南昌OA軟件 南昌OA新聞動態(tài) 南昌OA信息化 南昌OA快博 南昌OA行業(yè)資訊 南昌軟件開發(fā)公司 南昌門禁系統(tǒng) 南昌物業(yè)管理軟件 南昌倉庫管理軟件 南昌餐飲管理軟件 南昌網(wǎng)站建設(shè)公司