知識構(gòu)建的基本原理研究(上)|載體構(gòu)建原理
發(fā)布時間:2020-03-07 來源: 人生感悟 點擊:
[摘要]知識構(gòu)建的基本原理不僅表現(xiàn)在知識構(gòu)建需要一定的前提條件,而且表現(xiàn)在其知識狀態(tài)要發(fā)生由知識元→知識單元→知識結(jié)構(gòu)→知識空間的演變,還表現(xiàn)在其應(yīng)遵循的基本原則:知識元抽取原則、知識單元序化原則、知識結(jié)構(gòu)展示原則、知識空間優(yōu)化原則上。
[關(guān)鍵詞]知識構(gòu)建 基本原理 知識元 知識單元 知識結(jié)構(gòu) 知識空間 本體
[分類號]G350
1 引言
知識構(gòu)建(Knowledge Architecture,KA)是基于信息構(gòu)建(Information Architecture,IA)之上的更高層次的資源構(gòu)建形式,其核心內(nèi)容是由知識組織、知識標識、知識檢索和知識導(dǎo)航四個系統(tǒng)組成的,它能使知識更易于理解和吸收,為用戶提供比信息空間更高層次的知識空間。從“事實→數(shù)據(jù)→信息→知識→智慧→創(chuàng)新”的信息資源開發(fā)鏈來看,KA提供的是信息資源開發(fā)鏈較高層次的知識、智力,提供的是知識服務(wù),它更突出人與內(nèi)容的結(jié)合。
目前,人們對IA已進行了比較深入系統(tǒng)的研究,但對KA的研究卻剛剛開始,主要是圍繞著KA與IA的區(qū)別與聯(lián)系,從IA邁向KA的趨勢分析。所以,對KA的基本原理研究,已成為突破其理論與實踐發(fā)展的瓶徑。在現(xiàn)有基礎(chǔ)上對KA基本原理進行研究,首先應(yīng)采取比較研究方法,以便從與IA的區(qū)別中邁向KA的目標,從與M的聯(lián)系中尋求KA的發(fā)展;其次,將先進的知識技術(shù)應(yīng)用于KA,使KA建立的知識框架嵌入更完善的思想體系和復(fù)雜的背景因素。
2 知識構(gòu)建過程中知識狀態(tài)的演變
2.1 知識元――KA的理想基元
信息源于物質(zhì)的抽象變換,知識源于智能對信息的認知結(jié)果;信息和知識屬于兩個不同領(lǐng)域的實體,存在著依存和變換關(guān)系。實現(xiàn)信息向知識的轉(zhuǎn)化,是KA的首要環(huán)節(jié)。
文本是信息和知識記錄的載體,文本的知識內(nèi)容是由一個個獨立的知識元素按其邏輯關(guān)系進行組織排列的。這種獨立的知識元素人們稱之為知識元,邏輯依存關(guān)系稱為知識鏈。知識元是構(gòu)成知識結(jié)構(gòu)的最小獨立單元,用來表示一個個針對特定問題的解決方案,可以是概念、方法、規(guī)則、公理等數(shù)據(jù)或事實,以及實例化的知識。
知識元的本體特征與認知屬性更適合KA的需求。知識元可表示為:知識元=文本知識(本體論)+知識元語義概念(認知論)。知識元的本體特征為資源描述和查詢提供了必須的元素,知識元采用規(guī)范的形式語言、精確的句法和明確定義的語義,對領(lǐng)域中的概念與概念、概念與實體、實體與實體之間的關(guān)系進行預(yù)先標注,有效減少了系統(tǒng)內(nèi)各主體領(lǐng)域中概念和邏輯關(guān)系可能造成的誤解和歧義,具有良好的概念層次結(jié)構(gòu)和對邏輯推理的支持;知識元的認知屬性使信息檢索從字面匹配深入到知識元的層次,提高了檢索效率,在信息源的知識標引和檢索中具有重要意義。
知識元的獨立性、拓撲性和鏈接性是語義網(wǎng)格環(huán)境下KA的重要起點。利用知識元這些特性,語義網(wǎng)格便可在知識結(jié)構(gòu)、知識單元、知識元之間,通過知識鏈和語義鏈形成知識鏈網(wǎng)絡(luò)和語義鏈網(wǎng)絡(luò),進而構(gòu)畫出知識地圖,為知識的語義檢索提供了途徑。可見,基于知識元鏈接的知識網(wǎng)絡(luò)與語義網(wǎng)絡(luò)不僅為KA建立了知識地圖,而且實現(xiàn)了知識組織系統(tǒng)以知識元為基元的語義互聯(lián)推理體系結(jié)構(gòu),消除網(wǎng)絡(luò)資源孤島,為在語義網(wǎng)格中對知識的動態(tài)檢索與利用建立了知識導(dǎo)航。
知識元內(nèi)容的單一性與獨立性,便于KA的知識組織與檢索。內(nèi)容單一、獨立的知識元,容易選擇與之相適應(yīng)的最佳存儲和查詢,便于知識庫的構(gòu)建與檢索,便于用戶直接查詢知識元,組合知識元,改善自己的知識結(jié)構(gòu),從而加快知識創(chuàng)新速度。
上述三方面知識元優(yōu)勢的有機結(jié)合,不但保證了將知識元作為KA的起點,既符合知識檢索的要求,又遵從客觀知識結(jié)構(gòu)的本來面目;而且保證了基于知識元的知識組織體系的整體性和關(guān)聯(lián)性,為實現(xiàn)KA由等級式向網(wǎng)絡(luò)式轉(zhuǎn)變提供了理論和技術(shù)可行性,使知識元成為KA的理想基元。
2.2 知識單元――KA的基本對象
文獻單元是有形的物理單元,信息單元是表現(xiàn)文獻屬性的特征單元,而知識單元則是源于文獻單元和信息單元的知識內(nèi)容單元。若將每篇文獻看成是人類知識系統(tǒng)中的一個知識單元,知識單元與知識系統(tǒng)就組成了個性知識與共性知識系統(tǒng)。個性知識體現(xiàn)在知識的創(chuàng)新上,共性知識系統(tǒng)則表現(xiàn)在知識的完整性上。于是,知識系統(tǒng)={知識單元1,知識單元2,…,知識單元n},知識單元={知識元1,知識元2,…,知識元n}。
隨著人類知識管理的目標從知識載體和知識屬性特征過渡到知識內(nèi)容本身,知識管理的對象也經(jīng)歷了從文獻單元到信息單元既而到知識單元的演進過程。所以,出于對知識管理優(yōu)化的KA,必將知識單元視為自己構(gòu)建的基本對象。為此,文獻[7]對文本單元向知識單元轉(zhuǎn)化進行了研究,并提出了基于本體的OTKTS(Ontology-based Text Knowledge TransformSystem)系統(tǒng)模型。
2.3 知識結(jié)構(gòu)――KA的內(nèi)容主體
在KA活動中,知識建筑師(Knowledge Architects)需要在對知識內(nèi)容、用戶的知識需求以及知識環(huán)境理解的基礎(chǔ)上,對知識集合中的知識單元進行知識元抽取、分解,并對知識單元及其知識元進行本體語義標注,形成知識單元之間及其不同知識元之間的語義關(guān)聯(lián),從而建立起知識固有的層次結(jié)構(gòu)關(guān)系,使知識體系成為有序的關(guān)聯(lián)整體,這就是知識結(jié)構(gòu)。它是知識系統(tǒng)存儲知識及其進行交流的方式和渠道。因此,KA必將知識結(jié)構(gòu)納入其知識空間設(shè)計的內(nèi)容主體。
2.4 知識空間――KA的實現(xiàn)目標
網(wǎng)絡(luò)時代,KA更凸顯其空間特征。KA的任務(wù)就是要求知識建筑師們在知識空間規(guī)劃中,進行知識界面設(shè)計,建立知識結(jié)構(gòu)和知識路徑,并將知識結(jié)構(gòu)及其包含的知識內(nèi)容以科學(xué)的或藝術(shù)的方式在特定的知識空間中展示給用戶,使用戶易于發(fā)現(xiàn)和獲取所要的知識。可見,在KA過程中,不但要使信息向知識轉(zhuǎn)化,而且還要實現(xiàn)知識狀態(tài)由知識元→知識單元→知識結(jié)構(gòu)→知識空間的日益清晰化和可利用性遞進。這就需要在空間中實現(xiàn)對知識的控制,使知識的空間分布合理化,建立知識存取的空間秩序,實現(xiàn)KA的目標。
總之,KA的主要活動是組織知識內(nèi)容、生成知識結(jié)構(gòu)和規(guī)范知識空間,直接目標是建立一個清晰的、易于理解的知識空間結(jié)構(gòu),最后向用戶提供給一個良好的知識生態(tài)環(huán)境。因此,可以說KA的過程就是為知識單元生成一個合理的知識結(jié)構(gòu),并在特定的知識空間中展示這種知識結(jié)構(gòu)。
3 知識構(gòu)建的前提條件
我們尚不完全清楚從IA邁向KA的充分條件,但KA起碼要滿足以下必要條件。
3.1建立一種系統(tǒng)架構(gòu),提供智能交互的環(huán)境
正如T.Reamy所言:知識不是我們典型意義上存儲下來的東西,相反,我們存儲信息,是讓人們將它轉(zhuǎn) 化為知識。這意味著KA不僅關(guān)注存儲系統(tǒng)的結(jié)構(gòu),還要關(guān)注其中嵌入的、讓人們在信息系統(tǒng)中相互影響的、將信息轉(zhuǎn)化為知識的知識管理過程,并且要讓這個過程更容易、更快捷和更有生產(chǎn)力。
3.2 為不同的知識狀態(tài)建模,實行本體存儲,讓知識易于獲取
知識模型化為知識利用與知識采集之間架起橋梁。知識模型結(jié)構(gòu)必須能夠表現(xiàn)知識才能用于解決問題,其重要領(lǐng)域之一是概念本體的模型化。概念本體是某一領(lǐng)域或某一知識庫的廣義概念、屬性、關(guān)系和定理的說明。概念本體可以起到已采集知識的位置標識和組織結(jié)構(gòu)的作用,同時也提供人們了解知識用法的一個格式。
3.3 建立能夠捕捉隱性知識的特征概貌圖,強化人與人之間的知識聯(lián)系
挖掘個人頭腦中的隱性知識是知識管理的重要任務(wù),這個任務(wù)與KA的目標是一致的。KA不僅要為顯性知識,還需要為隱性知識建立可能的關(guān)聯(lián);不僅建立人與知識之間的聯(lián)系,還要建立人與人之間的知識關(guān)聯(lián)。
3.4 構(gòu)建知識地圖,進行知識導(dǎo)航
IA的一個重要產(chǎn)品是內(nèi)容地圖(Content Map),而KA要在內(nèi)容地圖的基礎(chǔ)上生成一個更豐富、更復(fù)雜、更多維、更人性化的知識地圖。知識地圖是已獲取的知識及其關(guān)系的可視化網(wǎng)絡(luò)結(jié)構(gòu),是知識資源的導(dǎo)航與定位系統(tǒng),它不僅能提示知識的存儲地點及其關(guān)聯(lián),提供用戶所需要的知識,而且還能夠直觀地提供知識的視覺展示。知識地圖除了關(guān)注內(nèi)容以外,還需要關(guān)注任務(wù)、人員和社團幾個維度,不僅對信息行為建模,還為它的人員、政策、技術(shù)和智能結(jié)構(gòu)建模。
在KA中,基于知識元的知識地圖的建立,能起到資源的知識連接和引導(dǎo)的作用,知識元描述的知識屬性有基本屬性和擴展屬性,包括貢獻者、類型、背景等信息。依據(jù)一般的需要,把知識地圖表示為圖表層、描述層,它們都是實際的知識資源層在可視化界面上的映射(見圖1)。
圖1中的知識單元及其知識元都是從信息資源的知識描述中提取出來的知識對象,表示不同的知識節(jié)點,節(jié)點之間的關(guān)系即為知識關(guān)聯(lián);知識關(guān)聯(lián)包括不同知識單元之間的隱含關(guān)聯(lián)、同一或不同的知識單元中知識元之間的直接聯(lián)系――知識元鏈接。知識鏈接提供了知識的詳細信息或知識本身的位置,知識描述提供知識節(jié)點更詳細的信息。知識節(jié)點、知識關(guān)聯(lián)、知識鏈接和知識描述有機地結(jié)合起來,共同構(gòu)成知識地圖,準確地表達了知識及其相關(guān)屬性,為KA的知識導(dǎo)航與檢索提供了坐標和路徑。
4 知識構(gòu)建的基本原則
4.1 知識元抽取原則
知識元是KA的理想基元,所以知識元的抽取是KA的起點和建立知識元庫的關(guān)鍵。
文本是記錄信息和反映知識的主要載體,而創(chuàng)新點則反映了其科學(xué)研究的創(chuàng)造性和科學(xué)性,是文本內(nèi)容的靈魂表現(xiàn)。所以基于創(chuàng)新點來建構(gòu)知識元可以解決文本創(chuàng)新知識的有效發(fā)現(xiàn)和利用問題。文本的創(chuàng)新點可根據(jù)文本特征進行判斷。一篇文本特征主要體現(xiàn)在題名、摘要、引言、正文、結(jié)論和參考文獻6個核心要素上,一般創(chuàng)新點分布在幾個不同的要素中,并有一些特定的表達形式。通過特征提取發(fā)現(xiàn)文本創(chuàng)新點,抽取與創(chuàng)新點相關(guān)的特征語句組成不同層次的知識元結(jié)構(gòu),判斷相關(guān)度、選擇合適的創(chuàng)新點知識元內(nèi)容,可實現(xiàn)基于創(chuàng)新點的知識元抽取。
在宏觀上,知識元的抽取應(yīng)遵守二條原則:①在知識元對象的選擇上,要建立信息與知識元的一致性、聯(lián)系的直接性、關(guān)系的簡明性。即知識元除了具有知識表示、推理、結(jié)論的共同特征外,還應(yīng)具有獨立性、唯一性、完整性和單一性。②在知識元對象的實體結(jié)構(gòu)上,應(yīng)同時體現(xiàn)編號、時間、地域、領(lǐng)域、對象、對象數(shù)值、單位、上屬對象、相關(guān)對象和數(shù)據(jù)來源等內(nèi)容項。
在微觀上,一個具體知識元的抽取應(yīng)遵循下面(見圖2)的步驟:①由文本標題詞定位知識元的方向;②由文摘詞確定創(chuàng)新點知識元的名稱;③從小標題及正文中找出帶有創(chuàng)新點具體內(nèi)容的語句;④將關(guān)鍵詞與知識元名稱比較;⑤建立創(chuàng)新點與知識元之間的信息譜關(guān)系,統(tǒng)計創(chuàng)新點與其有關(guān)的特征句的相關(guān)度,由特征句聚合成知識元譜。以此建立知識元的模糊語義網(wǎng)關(guān)系,實現(xiàn)文本知識元自動提取的算法。
4.2 知識單元序化原則
KA的效果要取決于組織知識后有效知識量的大小,而有效知識量的大小與知識組織的有序程度成正比。在KA過程中,之所以對知識單元中的知識元進行組織表示和關(guān)系確定,一是為了滿足人們對具體知識元的需求而建立知識元庫;二是為了使其組合成的知識單元得以序化而集成為知識倉庫,從而增強有效知識的含量,自覺控制知識結(jié)構(gòu)體系中的熵值,進而形成有條理、合邏輯、主題鮮明、主次關(guān)系清晰的知識結(jié)構(gòu)體系。為此,在應(yīng)用各種知識技術(shù)手段進行知識表示和知識組織時,知識建筑師們需要有所選擇,對知識進行有序集成,去除知識結(jié)構(gòu)體系中的無序組合,強化知識內(nèi)在邏輯關(guān)系的組織和條理,突出知識功能和主題的一致性,理清知識的層次關(guān)系。
4.3 知識結(jié)構(gòu)展示原則
知識結(jié)構(gòu)是知識建筑師與知識使用者溝通的媒介,有效地展示和表達知識結(jié)構(gòu)是知識建筑師必備的技能。因此,尋找一種表述框架、構(gòu)建一個協(xié)調(diào)一致的、功能化的知識體系結(jié)構(gòu),就是為了通過知識界面,有效地展示知識系統(tǒng)的結(jié)構(gòu)、風(fēng)格和特色,讓用戶能夠感知知識結(jié)構(gòu)中所存在的知識,方便地、迅速地從中獲得知識,以滿足對知識的需求,完成自己的任務(wù)。
4.4 知識空間優(yōu)化原則
知識空間優(yōu)化是指通過一系列知識組織與本體構(gòu)建技術(shù),在復(fù)雜且龐大的知識空間中幫助人們緩解知識環(huán)境造成的心理上的迷惑,擺脫行動困境,減輕知識導(dǎo)航與檢索的障礙,增強人們知識感知和知識捕捉能力,促進其知識接受和利用。知識空間優(yōu)化原則有宏觀和微觀兩方面的表現(xiàn)形式。
4.4.1 知識的宏觀空間 知識的宏觀空間主要是指知識在社會或自然界中分布的物理狀態(tài)。它可以是知識分布的社會空間或自然空間。
在知識的社會空間中,KA應(yīng)通過社會知識資源的有效配置、宏觀調(diào)控等手段,來構(gòu)建一個和諧的知識生態(tài)環(huán)境。充分考慮知識接受者和發(fā)送者雙方的社會空間特點,遵循用戶知識接受的有關(guān)法則,使客觀知識通過KA的促進而在整個社會中易于得到主觀化,也使主觀知識通過廣泛的社會共享便于得到客觀化,這也許就是和諧社會構(gòu)建的一個目標。
在知識的自然空間中,KA的對象既有形態(tài)上的多樣性、內(nèi)容上的復(fù)雜性,又有存儲上的分布性和組織上的異構(gòu)性,這就需要營造一個良好的知識集成環(huán)境。可喜的是,網(wǎng)格技術(shù)帶來了知識管理的革命。它可以整合分布、異構(gòu)、自治的知識資源,獲得透明的調(diào)用。
4.4.2 知識的微觀空間 知識的微觀空間主要是指宏觀空間中的知識系統(tǒng)(如信息機構(gòu)、信息系統(tǒng)等)和虛擬組織(如數(shù)字圖書館),主要體現(xiàn)在知識導(dǎo)航和檢索應(yīng)遵循的準則上。
空間縮小準則。在知識空間中,各種知識表達的標識代表各個知識(單)元,存取地址代表各知識(單)元的路徑。這樣,知識在知識系統(tǒng)中以知識節(jié)點一知識路標的形式實現(xiàn)了知識集合在空間中的分布秩序和存取秩序。這就使龐大的知識空間得以縮小,并使用戶易于知識發(fā)現(xiàn),節(jié)省查詢時間。
空間定位準則。當(dāng)知識(單)元被各種元數(shù)據(jù)和資源描述框架以編碼的方式定位在某個空間,成為有序知識的一個節(jié)點,它們以知識鏈的方式被不同空間所存取,在查詢時構(gòu)成一定的空間秩序。這就使用戶能在復(fù)雜的知識空間中快速準確地確定自己所需知識的具體位置而不迷失方向。在知識空間定位中,KA的主要任務(wù)是:①按知識的內(nèi)在聯(lián)系構(gòu)建知識存取系統(tǒng),使知識(單)元本體化、系統(tǒng)化、集成化。②用知識本體的語義互聯(lián)和匹配構(gòu)建知識查詢系統(tǒng),建立基本的存取秩序,實現(xiàn)對知識的有效控制,進而達到知識空間的優(yōu)化。③構(gòu)建知識地圖,進行知識可視化導(dǎo)航。
(待續(xù))
相關(guān)熱詞搜索:基本原理 構(gòu)建 知識 知識構(gòu)建的基本原理研究(上) 電路原理基本知識 化工原理基本知識
熱點文章閱讀