- 相關(guān)推薦
一種基于經(jīng)典領(lǐng)域本體構(gòu)建方法的改進(jìn)研究
語(yǔ)義網(wǎng)是現(xiàn)在的熱門(mén)研究課題,而組建語(yǔ)義網(wǎng)的基石是領(lǐng)域本體的構(gòu)建。如果沒(méi)有一個(gè)完善的本體,整個(gè)語(yǔ)義網(wǎng)的構(gòu)建也只能是一座空中樓閣。所以本體構(gòu)建在語(yǔ)義網(wǎng)研究中具有十分重要的地位。本體構(gòu)建的探討主要包括三個(gè)方面,即本體構(gòu)建方法、本體描述語(yǔ)言、本體構(gòu)建工具。其中本體構(gòu)建方法對(duì)本體構(gòu)建過(guò)程的實(shí)施具有指導(dǎo)性的意義,直接決定了本體對(duì)知識(shí)的表示和邏輯推理能力。如果沒(méi)有一個(gè)好的構(gòu)建方法的指導(dǎo),就很難保證本體構(gòu)建的規(guī)范化,進(jìn)而對(duì)基于本體的后續(xù)應(yīng)用也會(huì)產(chǎn)生巨大影響。
一、經(jīng)典本體構(gòu)建方法分析
國(guó)內(nèi)外的研究小組根據(jù)各自的項(xiàng)目提出了很多本體構(gòu)建方法,經(jīng)典的本體構(gòu)建方法有骨架法、評(píng)價(jià)法、METHONTOLOGY法、Bernerasetal(KACTUS)方法等等。骨架法對(duì)構(gòu)建框架和各階段的指導(dǎo)方針有參考價(jià)值而且有本體評(píng)估的步驟,但是每一步卻沒(méi)有具體的方法和技術(shù):評(píng)價(jià)法提出了本體獲取的新方法,明確提出了需求的問(wèn)題,但是沒(méi)有文檔化過(guò)程和步驟的說(shuō)明;METHONTOLOGY法有本體評(píng)估步驟,詳細(xì)描述了相關(guān)技術(shù)工具、知識(shí)來(lái)源,但是沒(méi)有具體的本體評(píng)估方法;Bernerasetal方法主要針對(duì)應(yīng)用驅(qū)動(dòng)的本體開(kāi)發(fā),但缺乏具體支持技術(shù)和本體評(píng)估、文檔化過(guò)程,不適合從無(wú)到有的本體構(gòu)建。
二、本體構(gòu)建方法的改進(jìn)探索
針對(duì)現(xiàn)有本體構(gòu)建方法的缺點(diǎn),一些學(xué)者做了一些有益探索。筆者在其他學(xué)者研究的基礎(chǔ)上,結(jié)合自己的想法提出了一種
新的本體構(gòu)建方案,具體步驟如下:
(一)領(lǐng)域本體需求分析。這個(gè)階段主要是要明確領(lǐng)域本體構(gòu)建和應(yīng)用目的、領(lǐng)域與范圍、表示方法、用途以及使用者等。
(二)考慮本體復(fù)用。明確要開(kāi)發(fā)的領(lǐng)域是否存在有現(xiàn)成的本體。如果不存在己有本休,則轉(zhuǎn)入第(三〉步:如果存在現(xiàn)成本體,則需要進(jìn)一步分析己有本體是否滿(mǎn)足需求,不滿(mǎn)足項(xiàng)目需求則轉(zhuǎn)入第(三)步,倘若滿(mǎn)足需求則進(jìn)入第(五)步。
(三)分析本體結(jié)構(gòu),列出領(lǐng)域重要術(shù)語(yǔ)。這一階段可以采用半自動(dòng)的方法從主題詞表、敘詞表、領(lǐng)域文獻(xiàn)庫(kù)或者關(guān)系數(shù)據(jù)庫(kù)中抽取關(guān)鍵術(shù)語(yǔ)和概念并加以整理,通過(guò)這一過(guò)程可以完成大部分的術(shù)語(yǔ)匯總,然后通過(guò)入工搜集或者本體的動(dòng)態(tài)學(xué)習(xí)機(jī)制擴(kuò)充完善術(shù)語(yǔ)。
(四)定義類(lèi)和類(lèi)層次關(guān)系。這一步可以細(xì)分為兩個(gè)小步驟即定義類(lèi)和定義類(lèi)層次關(guān)系。
1.定義領(lǐng)域本體中的類(lèi)。在步驟(三)中羅列出的大量的概念和術(shù)語(yǔ)處于一種混亂無(wú)組織并且彼此之間沒(méi)有關(guān)聯(lián)的狀態(tài),需要通過(guò)一定的邏輯規(guī)則對(duì)它們進(jìn)行分類(lèi),形成不同的子領(lǐng)域。此外還需要對(duì)這些概念和術(shù)語(yǔ)的重要性進(jìn)行評(píng)估,摒除那些超出領(lǐng)域范圍的概念和術(shù)語(yǔ),盡可能簡(jiǎn)潔和準(zhǔn)確的表達(dá)出領(lǐng)域知識(shí)。
2.定義類(lèi)之間的層次關(guān)系。建立類(lèi)之間的層次關(guān)系一般有自頂向下、自底向上、綜合法等幾種方式。自頂向下定義類(lèi)層次即首先定義領(lǐng)域中綜合性,概括性的類(lèi),然后逐步細(xì)化擴(kuò)展自最細(xì)小的類(lèi)。自底向上正好相反即先從最小類(lèi)的定義開(kāi)始,然后逐步向上級(jí)類(lèi)定義。綜合法是首先定義許多非常顯而易見(jiàn)的概念,然后分別對(duì)它們進(jìn)行恰當(dāng)?shù)臍w納和細(xì)化,從一些頂層概念著手,將它們與一些中級(jí)概念關(guān)聯(lián)起來(lái)。在具體的項(xiàng)目實(shí)施中可以根據(jù)實(shí)際情況采用合適的方法。
(五)本體的檢驗(yàn)和評(píng)價(jià)。由于領(lǐng)域知識(shí)的復(fù)雜性,領(lǐng)域邊界的模糊性,不同領(lǐng)域之間往往存在著交叉,本體的構(gòu)建很難一步到位?梢愿鶕(jù)Gruber所提出的五條指導(dǎo)原則來(lái)檢驗(yàn)和評(píng)價(jià)本體。如果不符合要求則返回第(三)步重新進(jìn)行本體分析并加以適當(dāng)?shù)男拚敝吝_(dá)到要求為止。此過(guò)程需要迭代進(jìn)行。
(六)本體的存儲(chǔ)。本體建設(shè)完成后,需要存儲(chǔ)本體。本體的存儲(chǔ)可以采用。吼文檔形式或者存儲(chǔ)為關(guān)系數(shù)據(jù)庫(kù)形式。。吼格式存儲(chǔ)比較簡(jiǎn)單,但是當(dāng)文檔數(shù)量比較大時(shí)用關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)本體就比較方便,可以根據(jù)實(shí)際情況進(jìn)行選擇。
三、結(jié)束語(yǔ)
隨著語(yǔ)義網(wǎng)研究的深入,本體構(gòu)建方法也將逐漸成熟。而從各個(gè)項(xiàng)目工程中總結(jié)出來(lái)的方法,并不能適合每個(gè)項(xiàng)目的要求,需要根據(jù)項(xiàng)目的情況加以修改。本文總結(jié)了一些主要的經(jīng)典本體構(gòu)建方法的特點(diǎn),提出了一種迭代的具有本體進(jìn)化特性的本體構(gòu)建方案,同時(shí)也試圖利用主題詞表、敘詞表、領(lǐng)域文獻(xiàn)庫(kù)等現(xiàn)有資源通過(guò)半自動(dòng)的方式抽取專(zhuān)業(yè)術(shù)語(yǔ)及其等級(jí)關(guān)系,以減輕在沒(méi)有本體復(fù)用情況下本體構(gòu)建的工作量。下一步的研究將通過(guò)實(shí)踐來(lái)檢驗(yàn)這一模型,以期使這個(gè)本體構(gòu)建模型更加完善化和相對(duì)通用化。
【一種基于經(jīng)典領(lǐng)域本體構(gòu)建方法的改進(jìn)研究】相關(guān)文章:
學(xué)科領(lǐng)域知識(shí)本體建設(shè)方法研究10-03
基于本體的概念設(shè)計(jì)知識(shí)管理研究08-12
淺談基于語(yǔ)義web的高校畢業(yè)生就業(yè)信息服務(wù)系統(tǒng)本體構(gòu)建研究10-19
專(zhuān)利資產(chǎn)評(píng)估方法的改進(jìn)研究09-03
基于本體的市場(chǎng)準(zhǔn)入知識(shí)獲取技術(shù)的研究與實(shí)現(xiàn)05-15
基于改進(jìn)的Ostu閾值的運(yùn)動(dòng)目標(biāo)分割方法07-26
基于環(huán)境視角的創(chuàng)業(yè)研究框架構(gòu)建06-26
一種改進(jìn)的粒子濾波算法的研究10-05