基于知識元的中醫(yī)古籍方劑知識表示研究.pdf_第1頁
已閱讀1頁,還剩211頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、方劑是由藥物配合組成的醫(yī)方。據(jù)統(tǒng)計現(xiàn)存有名和無名方劑20余萬首,記載于2000余種中醫(yī)古籍中,以古代的書面語言形式存在并傳播。
  知識表示是指把知識客體中的知識因子與知識關聯(lián)起來,以便于識別和理解知識。知識表示是知識組織的前提和基礎,任何知識組織方法都要建立在知識表示的基礎上。
  自然文本中所記述的知識是由多個概念集合在一起并且形成一定的關系而構成的,學者們對文獻的理解也是通過對相互關聯(lián)的一組詞的分析理解,然后獲得一個完

2、整的概念。文獻中的一個詞通常不能表達某個完整概念,往往是一組詞的相互關聯(lián),才能形成一個完整的概念,我們把中文文本中這種客觀存在的語言現(xiàn)象稱之為知識元。知識管理發(fā)展的趨勢顯示,人類知識處理經過了以篇為單位的文獻處理時期,正在進行以數(shù)據(jù)庫為單位的信息處理時期,將要進入以知識元為單位的知識處理時代。
  歷代古醫(yī)籍中所記載的內容眾多的方劑學知識,既包含有海量的關于疾病治療的方法和經驗,又蘊涵著豐富的中醫(yī)學理論。面對這樣一座恢弘的知識寶庫

3、,我們一方面為這些珍貴方劑知識得以傳承至今感到欣慰;另一方面,又為爬梳文獻的艱難過程倍感無奈。傳統(tǒng)的古籍整理手段以及知識獲取方式已不能完全滿足當前中醫(yī)學繼承發(fā)展的需求,古籍知識利用難的問題受到學者們的普遍關注。二十世紀末以來信息技術的發(fā)展,以及知識管理理論在古籍整理工作中的應用,催生了中醫(yī)古籍數(shù)字化研究的發(fā)展,古籍方劑中由于蘊含大量中醫(yī)學證法方藥間規(guī)律性的知識,并因其知識自身結構性較強,成為中醫(yī)藥數(shù)據(jù)挖掘研究的一個熱點,數(shù)據(jù)挖掘這一方法

4、被介紹到中醫(yī)藥研究中最早所公開發(fā)表的文章就是與方劑相關的。然而就目前見諸報道的研究成果,尚達不到知識服務的水平,距離語義檢索、知識發(fā)現(xiàn)等高級目標還有相當?shù)牟罹?,尤其隨著“e-Science”這一概念的提出,基于數(shù)據(jù)挖掘技術的知識發(fā)現(xiàn)方法引起越來越多研究者的關注。在既有數(shù)據(jù)基礎上發(fā)現(xiàn)新知識成為科學研究新的范式,這樣就對古籍自然文本向科學數(shù)據(jù)的轉換提出了更高的要求。
  計算機在中醫(yī)古籍數(shù)字化領域的應用長期得不到深入發(fā)展,究其原因主要

5、是古籍產生的歷史悠久,數(shù)量眾多,內容、結構復雜,各種關系的命題不清晰,蘊涵的復雜邏輯關系得不到充分表達。若要借助于計算機幫助實現(xiàn)對古籍知識的獲取,就必須建立一種深入文獻內部的知識組織方法。將古籍數(shù)據(jù)由自然記載形式過渡到適合計算機處理的表示形式,建立結構清晰、邏輯嚴謹?shù)闹R結構和語義關系網(wǎng)絡,在對知識合理表示的基礎上從而實現(xiàn)對知識的獲取。
  傳統(tǒng)古籍整理做章句的方法,以及編撰類書的工作經驗提示我們,古籍文本中同樣存在著可被抽取和單

6、獨管理的知識單元(知識體、知識元)。因此通過對中醫(yī)古籍文本進行科學合理的解構,揭示中文文本中蘊含的知識和信息,是知識發(fā)現(xiàn)的重要方法和途徑之一?;诖耍L華教授結合多年來從事古籍整理研究的經驗,結合傳統(tǒng)古籍整理的理論與方法,提出了“基于知識元的中醫(yī)古籍計算機知識表示方法”這一指導中醫(yī)古籍資源深入開發(fā)的新理論。該理論的提出,使得對中醫(yī)古籍知識的管理,由間接的文獻層面深入到直接的知識層面。
  本文以中醫(yī)古籍方劑知識元研究為核心,擬通

7、過對古籍文獻中知識元的抽取與標引,結構起以知識體為單元的知識組織體系:通過對語義成分間關系的標引,關聯(lián)起中醫(yī)古籍方劑知識語義網(wǎng)絡。從而構建起以知識元為核心的知識表示體系,并嘗試對該體系采用形式化的手段進行表達。主要內容包括:
  一、通過對《五十二病方》、《肘后備急方》、《輔行訣臟腑用藥法要》、《備急千金要方》、《外臺秘要方》、《太平圣惠方》、《太平惠民和劑局方》、《傷寒明理方論》、《普濟方》、《醫(yī)方考》、《祖劑》、《古今名醫(yī)方論

8、》、《湯頭歌訣》、《絳雪園古方選注》,以及《黃帝內經》、《傷寒雜病論》、《脾胃論》、《丹溪心法》、《本草綱目》、《傅青主女科》、《臨證指南醫(yī)案》等30余種包含方劑知識的各類古籍文獻體例的研究,在分析方劑知識特征的基礎上,對方劑知識體、知識元存在于古籍文本中的各種形式進行系統(tǒng)梳理。
  1、古籍方劑知識特征
  (1)從文獻學角度分析:中醫(yī)古籍方劑知識表現(xiàn)為內容眾多、分布廣泛、重復性高、相似度大、體裁多樣、版本差異等特點。

9、r>  (2)從科學數(shù)據(jù)角度分析:中醫(yī)古籍方劑知識存在自然語言的高度歧義性、概念間語義關系復雜、數(shù)據(jù)缺失等問題。
  2、方劑知識體與知識元在古籍文本中的存在形式
  (1)方劑知識體聚類出現(xiàn);方劑知識體與其他知識體相關出現(xiàn)。
  (2)方劑知識元分散分布;方劑知識元聚合分布。
  二、參照中醫(yī)古籍方劑語義元數(shù)據(jù)規(guī)范,對方劑元概念所指的內涵外延進行界定。通過對古籍方劑知識體、知識元進行結構化定義,為知識體、知識元

10、的抽取和標引提供客觀依據(jù)。
  1、中醫(yī)古籍方劑語義元數(shù)據(jù)體系
  中醫(yī)古籍方劑語義元數(shù)據(jù)體系包括10個核心元數(shù)據(jù):“方名”、“出處”、“功用主治”、“組成”、“制法”、“用法”、“加減”、“方解”、“附方”、“附案”,及在此基礎上的擴展規(guī)則。
  2、知識體、知識元結構化定義
  BK:=
  EK:=

11、KC>
  三、從古籍文獻中分析抽取出典型的方劑知識體、知識元,將自然文本中邏輯統(tǒng)一的數(shù)據(jù)分割成可以獨立管理的知識單元(知識體、知識元二級),結構起以知識體為單元的知識組織體系,并以此作為方劑知識語義網(wǎng)絡研究的素材。
  四、對知識元構成要素--語義成分,進行歸納、分類,厘清各種語義類型,從而規(guī)范中醫(yī)方劑知識領域內的各種概念。對語義成分進行合理分類,可以為高效、簡潔、可理解、低歧義的形式化表達奠定下重要基礎。
  1、

12、定義了中醫(yī)古籍方劑知識領域25種語義類型
  方劑、方類、藥物、炮制、劑量、單味藥、病證、證候、病因病機、治法、經絡、臟腑、部位、食物、時長、時點、頻率、器具、火候、規(guī)格、時令、地域、人群、人物、書籍。
  2、對概念內涵與外延進行界定,并對容易混淆的概念進行了分析比較。
  五、通過對方劑知識中各種概念間關系的研究,定義各種語義關系,將古籍中的方劑知識抽象為命題化的表述形式,并對各種運算和推理規(guī)則進行設計和定義。

13、r>  1、定義了中醫(yī)古籍方劑知識領域46種語義關系
  等同關系、屬分關系、整部關系和為數(shù)眾多的相關關系。相關關系包括:組方關系、炮制關系、用量關系、代用關系、功效關系、治療關系、導致關系、表現(xiàn)關系、配伍關系、祖衍關系、合和關系、歸經關系、君藥關系、臣藥關系、佐藥關系、使藥關系、鑒別關系、先煎關系、后下關系、包煎關系、單煎關系、溶化關系、沖服關系、溶媒關系、賦形關系、藥引關系、包衣關系、制時關系、制程關系、制火關系、制器關系、貯

14、器關系、規(guī)格關系、用時關系、用頻關系、用程關系、適用關系、禁忌關系、刊載關系、編著關系、創(chuàng)制關系、發(fā)揮關系、評按關系。
  2、對容易混淆和產生歧義的語義關系進行了比較說明。
  3、嘗試給出部分命題的推理運算規(guī)則。
  六、建立面向中醫(yī)方劑知識領域的符號命名規(guī)范,對知識體、知識元、語義類型、語義關系進行命名;建立面向中醫(yī)方劑知識領域的符號運算規(guī)則體系和符號推理規(guī)則體系,符號體系的建立是實現(xiàn)知識表示體系形式化表達的工具

15、。
  1、知識體、知識元符號命名
  2、語義類型符號命名規(guī)則
  3、語義關系符號命名規(guī)則
  七、將中醫(yī)古籍方劑知識領域各種語義關系分別納入關聯(lián)含義和關聯(lián)對象兩種分類體系下,進行比較研究,以進一步實現(xiàn)對語義類型和語義關系的精確化定義。并對其符號命名規(guī)范進行驗證與修正,從而設計出最為合理適度的符號表達方式。
  八、利用以上構建的基于知識元的中醫(yī)古籍方劑知識表示體系,對方劑知識進行解析,通過從具有代表性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論