本體感覺評估量表 本體評估工具的比較分析
發(fā)布時間:2020-03-07 來源: 歷史回眸 點擊:
[摘要] 對ODEval、OntoQA、Core、OntoManager四個本體評估工具的系統(tǒng)結(jié)構(gòu)體系進行分析,從工具所用的評估方法、工具的評估機制、工具的使用者、工具的作用范圍、工具的可操作性及有效性5個層面進行比較分析,明確其各自側(cè)重點和差異,以幫助本體開發(fā)者及最終用戶選擇適合自身需要的在國際范圍應用廣泛、具備發(fā)展前景的本體評估工具。
[關(guān)鍵詞] 本體評估工具 ODEval OntoQA Core OntoManager 工具比較
[分類號] G354.2
1 引 言
目前,本體通過提供某個特定領(lǐng)域的相關(guān)概念及這些概念之間的關(guān)系而廣泛應用于知識工程、信息組織及語義Web等各個方面。隨著本體體系的發(fā)展,對本體進行評估成為本體發(fā)展中的關(guān)鍵問題。一方面,本體評估對于指導本體構(gòu)建過程并保證所構(gòu)建本體最大程度地滿足應用需求起重要作用;另一方面,最終用戶選擇最符合自身需要的本體時,本體評估也是必不可少的。此外,本體評估在本體重用、自動或半自動的本體學習技術(shù)以及本體管理與規(guī)范化建設(shè)中都有著重要作用。
我國關(guān)于本體的建設(shè)與研究尚處在不斷完善的過程中,對本體的評估研究才剛剛起步,國外對于本體的評估已受到專家學者關(guān)注。本文基于目前國內(nèi)外本體評估方法類型及其研究現(xiàn)狀,選擇并分析了目前應用比較廣泛的四種本體評估工具ODEval、OntoQA、Core、OntoManager,旨在通過對這些工具的比較研究幫助本體開發(fā)者及最終用戶選擇適合自身需要的評估工具,并促進本體的規(guī)范化建設(shè)。
2 本體評估方法
本體評估的核心是評估角度的全面化,即以多維視角的評估內(nèi)容來綜合衡量本體的質(zhì)量。當前研究者從不同角度提出各種類型的本體評估方法,如Onto-Metric、oQual、OntoClean等,綜合各類方法,Jannz Brank等人把本體評估方法分為以下四類:
?基于“黃金標準”的方法,即將所構(gòu)建的本體與一個現(xiàn)有公認的比較成熟的“黃金標準”進行比較,羅列出其不足并進行改進。
?基于本體應用的方法,即在一個特定應用環(huán)境如語義網(wǎng)、信息檢索中,測試一組本體以確定適合該應用的本體。
?基于語料庫的方法,即使用術(shù)語抽取算法從語料庫中抽出術(shù)語,計算被本體覆蓋的術(shù)語數(shù)量,或是用一個向量來表示本體和語料庫,然后計算本體向量與語料向量之間的差距。
?基于一套預先定義好的原則和必要條件等進行評估的方法,其多是從構(gòu)建本體的原則來評估本體。
隨著越來越多本體評估方法的提出,創(chuàng)建能夠運用這些方法從而使評估工作更易進行的本體評估工具就顯得越來越重要。筆者選用的四個本體評估工具:ODEval、OntoQA、Core、OntoManager的創(chuàng)建都使用了上述一種或幾種方法,它們基于本體的不同側(cè)面來檢測本體構(gòu)建規(guī)劃、本體構(gòu)建過程、本體應用以及本體維護等階段出現(xiàn)的問題或錯誤,包括本體句法層面的正確與否、本體設(shè)計結(jié)構(gòu)上的合適與否以及本體相對于領(lǐng)域知識表示完整與否等。
3 國外現(xiàn)有本體評估工具
3.1 ODEval
ODEval是Corcho等人于2004年提出的,從知識表示角度評估用RDF(s)、DAML+OIL和OWL語言表示的本體的本體評估工具。
ODEval使用基于圖理論的運算法則來檢測本體概念分類存在的問題。在這個運算法則中,把本體的概念類看作一個定向的曲線圖G(V,A),其中V是一組節(jié)點,A是一組定向的弧線。節(jié)點集V和弧線集A所表示的具體元素因表示本體語言和問題類型的不同而有所差異。如表1所示:
3.2 OntoQA
OntoQA是Samir等人于2005年提出的結(jié)合了用戶需要對本體進行評估的工具。OntoQA提供具體的指標來定量評估本體的質(zhì)量。評估指標分為兩類:模式(schema)指標和實例(instance)指標。模式指標組指用來評估本體結(jié)構(gòu)設(shè)計的指標;實例指標組指評估本體內(nèi)實例分布的指標,包括知識庫指標和類指標。知識庫指標將知識庫作為一個整體來評估,類指標評估本體結(jié)構(gòu)中定義的類在知識庫中的運用方式。如表2所示:
3.3 Core
Core(Collaborative Ontology Reuse and Evaluationsystem)是Femdndez等人于2006年提出的基于本體排列的應用于本體重用和本體評估的工具。Core根據(jù)已選出的標準準則來評估本體,這個準則涉及黃金標準和用戶需要兩個方面。在黃金準則方面,Core通過詞匯評估層面和分類評估層面對本體進行評估。詞匯評估層面使用一套詞匯評估方法評估黃金標準和所選本體的相似性,通過比較表示它們所描述領(lǐng)域的詞匯條目來實現(xiàn);分類評估層面評估所選本體的“is-a”層級結(jié)構(gòu)和黃金標準結(jié)構(gòu)的重疊程度。在此基礎(chǔ)上,Core通過以下三個模塊組成的體系結(jié)構(gòu)來完成對一系列相關(guān)本體的評估:
?黃金標準技術(shù)設(shè)計模塊:用戶通過自然語言處理從其感興趣的相關(guān)文檔中得出根詞匯,并使用WordNet和它提供的同義及反義關(guān)系擴展根詞匯,以此構(gòu)建包含新詞匯的詞匯黃金標準。
?系統(tǒng)推薦模塊:用戶選擇一套評估準則,然后根據(jù)這套準則將所要評估的本體與黃金標準進行比較,選出并按相似度排列與黃金標準接近的本體。
?協(xié)作性評估模塊:本體的某些特征(例如可讀性、靈活性等)無法通過自動化的機器直接進行評估,因此需要用戶參與,此模塊綜合用戶需要及上述評估結(jié)果得出最終排序。
3.4 OntoManager
OntoManager是Nenad等人于2002年提出的一個適于本體工程師、領(lǐng)域?qū)<壹靶袠I(yè)分析家使用的管理系統(tǒng),它可以根據(jù)用戶需要找出不足以促進本體完善,并能促進管理人員問責制的發(fā)展。其主要任務是通過收集用戶應用本體的交互性數(shù)據(jù)來了解用戶需求,以避免通過調(diào)查問卷等繁瑣方式獲取數(shù)據(jù),從而評估本體滿足用戶需求情況。
OntoManage的實現(xiàn)基于概念體系結(jié)構(gòu)MAPE(Mo―nitor Analyze Plan Execute)模型,其把管理體系機構(gòu)提煉為四個功能:①監(jiān)控功能,收集、整理并過濾用戶使用本體的交互性數(shù)據(jù);②分析功能,整合所收集到的數(shù)據(jù)并使其可視化,提出本體修改建議;③計劃功能,規(guī)劃出適用于本體修改的行動;④執(zhí)行功能,根據(jù)對本體做出的調(diào)整,更新本體的應用。整體來看,OntoManager由三個模塊組成:
?數(shù)據(jù)整合模塊:整合、收集、預處理并組織用戶應用本體的行為信息數(shù)據(jù)。
?可視化模塊:把上述數(shù)據(jù)以易于理解的可視化形式表示出來,即通過圖表、表格、條形圖等方式來實現(xiàn)。
?分析模塊:引導本體進行改變以適應用戶需要,從而完成本體進化完善以及實例抓取兩項任務。
4 本體評估工具的比較分析
不同的本體評估工具是從不同的視角針對不同領(lǐng)域的、不同類型的、用不同知識表示形式表示的本體而創(chuàng)建的,且沒有一個本體評估工具能成功解決本體存在的所有問題。我們從評估方法、評估機制、使用者、作用范圍、可操作性及有效性等指標來比較上述四種本體評估工具。指標的比較如表3所示:
4.1 工具所用評估萬法
本體評估工具都是使用一定的評估方法來創(chuàng)建的,在選用評估方法上,本體評估工具會針對評價的重點及其評估視角來做相應選擇。
ODEval基于邏輯規(guī)則視角,通過本體表示語言的邏輯規(guī)則來評估本體。其使用了基于原則的評估方法。盡管目前一些本體剖析器和本體平臺可用于檢測用RDF(s)、DAML+OIL和OWL語言表示的本體,例如ICS-FORTH Validating RDF parser、OWL Validator等,但它們只能檢測出簡單的循環(huán)問題,而對于分割錯誤和冗余問題大多束手無策,而該工具可有效地評估本體內(nèi)容中的不一致和冗余。
OntoQA、Core都是基于指標視角的評估工具,利用指標的綜合性從不同方面評估本體。OntoQA使用了基于語料庫和基于原則的綜合評估方法,通過具體指標幫助用戶分析所選本體的適用性,Core使用了基于黃金標準和基于應用的評估方法來對本體進行評估并排序以供選擇適用性高的本體。
OntoManager基于本體進化視角,通過總結(jié)本體生命周期的變化來評估本體,例如領(lǐng)域知識的變化導致的本體內(nèi)容結(jié)構(gòu)的變化、本體知識表示語言的相互轉(zhuǎn)化所導致的格式變化等。其使用了基于用戶應用的評估方法,分析用戶使用數(shù)據(jù)來持續(xù)管理、評估并完善本體。
4.2 工具的評估機制
ODEval作用于本體模型創(chuàng)建階段,它執(zhí)行RDF(s)、DAML+OIL和OWL本體的句法評估,它使用基于圖理論的自動檢測程序,通過對本體表示語言中詞條的檢測來檢測本體創(chuàng)建過程中出現(xiàn)的本體概念分類的不一致和冗余等問題。OntoQA將所設(shè)計的評估指標存儲于基于Java語言的程序原型中,運用SeasameRDF store來下載本體的模式和知識庫,形成OntoQA本體評估工具。Core根據(jù)已選出的標準準則通過自動相似度檢測方法對一組本體進行排序,即從其提供的標準準則中選擇一個子集,而基于每種標準都可以得出一個本體排序,然后使用能把這些標準綜合起來考慮的融合性排序技術(shù)并結(jié)合用戶需要得出最終的本體排序。OntoManager通過門戶網(wǎng)站或應用來關(guān)注最終用戶需求,即跟蹤用戶在日志文檔中應用的交互作用,收集有用的能夠用于評估用戶主要興趣域的信息,通過這種信息的變化來尋找并及時反映本體領(lǐng)域知識所發(fā)生的變化,以此來評估并不斷地完善本體,此機制表示為一個“使用環(huán)”,如圖1所示:
4.3 工具的使用者
本體評估工具的使用者包括本體開發(fā)者和最終用戶。前者包括本體構(gòu)建者、本體管理人員等領(lǐng)域?qū)<。本體開發(fā)者需要評估工具來完善本體;用戶需要評估工具來對一組內(nèi)容相近的本體的質(zhì)量進行評估從而選擇最適合其需要的本體。Sabou等認為本體選擇和本體評估相互補充,起過濾作用的本體選擇是先于本體質(zhì)量評估的,且用戶角度的本體評估工具有助于本體選擇和本體評估的實施。目前隨著本體使用范圍的擴大,研究人員也開始關(guān)注最終用戶對本體的評估。
ODEval和OntoManager的使用者是本體開發(fā)者。ODEval適用于創(chuàng)建本體階段的使用;OotoManager適用于本體構(gòu)建完成后本體的更新完善階段的使用。On-toQA和Core的使用者既包括本體開發(fā)者也包括最終用戶。OntoQA是從用戶視角創(chuàng)建的,為了更大程度地滿足用戶在評估本體質(zhì)量基礎(chǔ)上選擇本體的需求;Core的實施在自動檢測方法的基礎(chǔ)上也需要最終用戶的參與,以用戶評價結(jié)果為重要組成部分。
4.4 工具的作用范圍
Guarino把本體類型分為頂層本體、領(lǐng)域本體、任務本體和應用本體。頂層本體通常表達的是常識性概念,如空間、時間、事件、行為等,與具體應用無關(guān)。頂層本體可能沒有實例填充,而其他本體在被構(gòu)造好之后需要人工或自動、半自動化填充實例。有的本體評估工具僅作用于本體的模式而忽略了在被填充本體的知識庫中運用的知識。
ODEval因為其使用于本體模型構(gòu)建階段,只作用于本體的模式,而OntoQA、Core、OntoManager既作用于本體模式,也作用于本體的知識庫,這樣既對本體概念體系做出了相應的合適度評估,也對本體中實例分布情況、豐富程度、實例反應領(lǐng)域知識情況等做出了更全面的評估。
4.5 工具的可操作性及有效性
ODEval是一種自動檢測工具,沒有最終用戶使用界面,但它易于被本體開發(fā)者所掌握,從而幫助本體開發(fā)者設(shè)計出沒有知識概念分類異常的本體。
OntoQA、Core、OntoManager都包含從用戶角度進行評估的層面,可以確保在開發(fā)本體過程中所產(chǎn)生的建議反映用戶的需要。OntoQA有易于操作的用戶界面,且OntoQA正嘗試開發(fā)可適用于Web的評估界面,適用范圍會更廣。
Core有易于操作的用戶界面,適用于本體評估和本體重用。用戶可根據(jù)自身需要對頁面上的指標進行設(shè)置從而得出最符合自身需要的本體排序,參考價值高,可操作性強。
OntoManager根據(jù)用戶需求來支持本體的管理和優(yōu)化,它是一個易于管理人員使用的管理系統(tǒng),但很難有深入的評估,不適合最終用戶使用。
相關(guān)熱詞搜索:本體 評估 工具 本體評估工具的比較分析 本體評估方法研究綜述 本體評估方法研究
熱點文章閱讀