當前位置:工程項目OA系統(tǒng) > 領域應用 > 醫(yī)院管理OA系統(tǒng) > 門診收費管理系統(tǒng)
淺析數據挖掘技術在電子病歷中的應用
在建設數字醫(yī)療的基礎之上,電子病歷應運而生,其短暫的歷史和迅速的崛起形成鮮明對比,在社會信息建設進程中擔當了重要角色,并回應了強烈的社會醫(yī)療訴求,將醫(yī)療服務的手段和模式推向縱深。在這一短暫的本土化發(fā)展進程中,電子病歷由簡單文字紀錄載體,迅速進化為多樣式的健康信息體系,其集成能力日益強大,其交換整合能力使醫(yī)療信息流通得到加強。在當前醫(yī)療信息化需求的驅動之下,電子病歷完成了系統(tǒng)搭建,使信息化滲透到臨床工作中。
反觀電子病歷的技術發(fā)展史,立足于眼前需求的功能實現已經完成:最早進行電子病歷實踐的地區(qū)和單位,都已擁有固定的運作經驗,基于電子病歷的診療新流程得到確立。進一步地,如何挖掘長遠價值、發(fā)揮長期效益,成為電子病歷發(fā)展的下一個主題。筆者認為,數字化醫(yī)療建設的真正意義,在于如何利用好這些長期積累的數據。對數據資源的開發(fā)利用,將使電子病歷的意義得到淋漓盡致的展現,使其可交換性、可用性得到充分發(fā)揮。由此,電子病歷后續(xù)發(fā)展的主題,明確指向“如何進行數據挖掘”。
1 廣義數據挖掘
1.1 數據挖掘的含義
數據挖掘是揭示存在于數據里的模式及數據問的關系的學科,它強調對大量觀測到的數據的處理。數據挖掘能夠從大量的、不完全的、有噪聲的、模糊的、隨機的數據集中識別有效的、新穎的、潛在有用的、最終可理解的模式。它是一門涉及面很廣的交叉學科,涉及機器學習、模式識別、統(tǒng)計學、智能數據庫、知識獲取、數據可視化、高性能計算、專家系統(tǒng)等學科。數據挖掘的成果可以用在信息管理、過程控制、科學研究、決策支持等許多方面。
1.2 數據挖掘的產生與發(fā)展
數據挖掘最初脫胎于統(tǒng)計學,通過計算機,對大量復雜的數據集自動進行探索性分析。盡管數據挖掘和統(tǒng)計分析之間有明顯的聯(lián)系,迄今為止大部分的數據挖掘方法并不產生于統(tǒng)計學科。正因為數據挖掘工作對商業(yè)、工業(yè)及科學研究具有極大的影響,在有需求的領域里,關于數據挖掘的研究總有可觀的成績。
1.3 被挖掘數據源的形式
被挖掘的數據源有多種形式,目前可歸納的主要有:關系數據庫、面向對象數據庫、空間數據庫、時態(tài)數據庫、文本數據源、多媒體數據庫、異質數據庫、遺產(1egacy)數據庫,以及Web數據源。簡言之,大量數據庫技術的發(fā)展,令數據存量大量增加,“數據爆炸但知識貧乏”,由此催生了數據挖掘技術,以獲得海量數據背后隱藏著的知識。
2 特殊語境下的數據挖掘
數據挖掘總是在某一特定知識領域內進行,具有普遍適用性的數據挖掘技術尚未出現。這由數據挖掘本身的難點決定。首先,巨量數據集的性質非常復雜,非線性、時序性與噪音普遍存在;其次,數據分析的目標具有多樣性,而復雜目標無論在表述還是在處理上均與領域知識有關;第三,在復雜目標下,對巨量數據集的分析,目前還沒有現成的且滿足可計算條件的一般性理論與方法。在實際應用中,特定知識領域的確認,有效回避了數據挖掘的瓶頸問題。電子病歷的應用就是這樣一個明證。作為特殊法律文書,病歷本身是嚴肅而確定的:知識領域的專注使數據噪音大量削減,使數據源形式簡化,使分析目標明確,使語義指代明顯,語義強度能夠有序排列。另一方面,病歷固有的格式要求和行文習慣,很好地解決了非線性問題和時序性問題。
在特定知識庫、特殊語言環(huán)境下,廣義數據挖掘的難點被一一回避。因此,盡管廣義數據挖掘還有很長的道路,還有諸多的分歧,但在電子病歷中,專注于臨床知識的數據挖掘應用是合理可行的,是符合現實的。
3 基于結構化采集的數據挖掘
3.1 預結構化
預結構化電子病歷是繼“WORD電子病歷”之后的一大飛躍。最初,一些醫(yī)院采用WORD存儲電子病歷,將病歷文本予以電子存儲,除去存儲和書寫方式的變化,病歷本身沒有發(fā)生任何變化。其功能展開、數據交換、數據挖掘完全無法進行。隨著社會信息建設要求的提高,數據應用的意義得到重視。以WORD存儲電子病歷,無法對病歷數據進行開采和利用,只是數據垃圾的堆積。于是,電子病歷結構化的理念在業(yè)界達成了高度一致?;诋敃r的技術水平,開發(fā)了“預結構化”模式:在病歷中,按照醫(yī)學專業(yè)要求,將知識點提煉,并逐一羅列,使用醫(yī)學規(guī)范用語和診斷專業(yè)術語書寫。所生成的電子病歷,能夠被識別,從而實現病歷的檢索、分析和質量控制,能夠為專家系統(tǒng)所理解,從而為教學科研提供依據。預結構化模式的典型特征是病歷模板的應用。病歷模板的原型是紙質病歷中的表格病歷。借鑒表格病歷的邏輯,病歷模板提煉出了病歷記錄的必須項目,必須內容, 以及必須形式。在固定的形式下,將項目和內容盡數羅列,提供單選、多選的錄人形式。
由于知識庫的支持,電子病歷模板相對靈活方便。根據前文選擇錄入的內容,內部邏輯自動進行選擇性地顯示,過濾無關項目。其次,病案首頁、檢驗報告等文書的格式固定,內容明確,預結構化的模板完全能夠使之功能得到最大發(fā)揮。最后,病歷模板分離了存儲,實現了“動態(tài)模板”,以方便臨床工作者重復不斷地修改和完善模板,盡管如此,在實際使用中,預結構化的模板帶有決定性的缺失。模板本身是對自然語言的解構,借助于醫(yī)學的確定范疇和固定形式,這一過程確實能夠圓滿實現。但它同時也肢解了自然語言的流暢性和靈活性。當醫(yī)生需要以獨立完整的語言進行描述時,他們便拋棄了病歷模板。繞過病歷模板的錄入方式,使預結構化喪失了用武之地。
3.2 后結構化
實踐表明,自由文本和預結構化病歷的使用,難以滿足臨床科研數據管理與統(tǒng)計的要求,而嚴格的表格化病歷限制了臨床描述能力,為了準確表述臨床行為,甚至需要另外撰寫手工病歷,遭到臨床醫(yī)生的反對。
為了兼顧臨床和科研,后結構化應運而生。后結構化的語義分析模型,最終是將語義元素的固有關系進行遍歷,結合語義強度等因素,對自然語言進行處理。基于這一模型,得以對純文本的病歷內容進行結構化采集。在首頁、醫(yī)囑、各類檢查化驗報告、病程記錄、護理記錄等良好的結構化文書之外,病歷的主觀描述部分也實現了完全結構化。解析自然語言的過程稱為“后結構化”。與預結構化不同,后結構化并沒有設定采集范式,沒有設定數據的抓取結構,因而并不要求細致的填充。后結構化技術維護了病歷描述的自然語境。后結構化有兩大關鍵難點。首先是機器學習還相當幼稚。在預結構化中,由于抓取和采集的框架已經確定,解析和計算的邏輯相對固定,因而基本不需涉及機器學習。但在后結構化模式中,各種挖掘模式都有應用(如回歸模式、聚類模式、關聯(lián)模式、序列模式等), 因而其規(guī)則抽取也更為復雜。作為一種機器學習方法,神經網絡規(guī)則抽取的重要指標:泛化精度、保真度、可理解性,目前仍處于較低水平。其次,漢語言不同于依附語范疇的語言(諸如英語),其轉格及形式缺乏顯著標志,給結構化處理帶來了難度。此外,漢語言的詞性詞義只在特定語境中才能確定,同一詞語可支持多種表義,多種詞性,有很大的機會令算法進入死循環(huán)。因此,關于漢語言的結構化研究進度遲緩。綜上所述,數據挖掘是電子病歷發(fā)展到相當程度的必然要求。而在電子病歷的應用中,實現數據挖掘的關鍵,即結構化采集。盡管存在著大量難點,但在強大的需求面前,結構化研究擁有良好的發(fā)展環(huán)境,必然能獲得長遠的發(fā)展。
參考文獻
1 俞文敏.電子病歷應用中存在的問題及解決方案探討[J].東南國防醫(yī)藥,2006,8(1):66—67.
2 劉靜,沈蓓,黃學寧,等.電子病歷中結構化描述內容與??撇v模板[J].現代醫(yī)學,2005,33(6):4]7—419.
- 1cMS將在201 1年5月啟動有效應用獎勵
- 2武漢啟動“智慧醫(yī)療工程”
- 32008年5月五原縣醫(yī)院2期工程成功簽約
- 4帶來醫(yī)療安全等方面的問題,這方面工作的滯后必然
- 5電子病歷的法律證據價值初探
- 6手外科電子病歷的設計與實現
- 72008年4月成功實施磴口縣婦幼保健院
- 8電子病歷系統(tǒng)利用無線網絡有了新的應用模式
- 9試論門診醫(yī)生工作站上線
- 10區(qū)域醫(yī)療信息共享平臺研究與實現
- 11建立專家評審制度提高電子病歷內涵質量的實踐
- 12臨床信息系統(tǒng)與電子病歷
- 13電子病歷系統(tǒng)及其數據集成的研究
- 14基于循證醫(yī)學本體論的臨床元數據設計方法研究
- 15醫(yī)院信息管理系統(tǒng)在醫(yī)院管理中的作用
- 16電子病歷在醫(yī)院信息系統(tǒng)中的探討
- 17無紙化電子病歷存儲模式在門診收費管理系統(tǒng)化中的研究與實踐
- 18海南省推行電子病歷
- 19中國HIS企業(yè)發(fā)展思考與展望
- 20l以電子病歷為核心,東軟助推盛京醫(yī)院數字化醫(yī)療新鼴 模式
- 21電子病歷“有效使用”的概念及對推廣應用的意義
- 22衛(wèi)生法教學案例素材的收集與應用
- 231065份護理電子病歷書寫缺陷分析與對策
- 24基于UM L 的電子病歷設計
- 25醫(yī)院船電子病歷系統(tǒng)構建方法探討
- 26結構化電子病歷系統(tǒng)應用與體會
- 27基于電子病歷系統(tǒng)的臨床路徑管理應用研究
- 28社區(qū)醫(yī)療電子病歷可行性技術探討
- 29電子病歷監(jiān)控數據失實原因分析及對策
- 30電子病歷無紙化歸檔存儲研究與應用
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓