文獻(xiàn)資源集成揭示的思路與實踐_文獻(xiàn)研究法的意義
發(fā)布時間:2020-03-07 來源: 散文精選 點擊:
[摘要]從資源建設(shè)模式和出版模式的轉(zhuǎn)變對文獻(xiàn)資源組織產(chǎn)生的影響出發(fā),通過分析文獻(xiàn)資源集成的原理和目前主要的集成模式,總結(jié)中國科學(xué)院文獻(xiàn)資源集成揭示的內(nèi)容和對象,提出中國科學(xué)院文獻(xiàn)資源集成揭示系統(tǒng)的實施策略。
[關(guān)鍵詞]文獻(xiàn)資源信息資源集成揭示
[分類號]G250.7
中國科學(xué)院(以下簡稱“中科院”)文獻(xiàn)情報系統(tǒng)中長期規(guī)劃的戰(zhàn)略目標(biāo)之一是建立強大的公共信息平臺,通過無縫整合現(xiàn)有服務(wù)流程和廣泛信息資源,實現(xiàn)充分方便的集成檢索,無縫鏈接,動態(tài)擴展和聯(lián)合服務(wù)。文獻(xiàn)信息資源是公共信息平臺的重要組成部分,文獻(xiàn)信息資源的集成揭示是中國科學(xué)院國家科學(xué)圖書館三期創(chuàng)新的重要任務(wù)之一。
1 相關(guān)研究文獻(xiàn)綜述
筆者在LISA數(shù)據(jù)庫中用“integrat*0raggregat*”進(jìn)行檢索,在用年代做限定后,分別得到如下結(jié)果:從LISA最早收錄年代到1969年共檢索到25篇文獻(xiàn),20世紀(jì)70年代共有128篇文獻(xiàn);80年代有386篇文獻(xiàn),90年代上升到826篇文獻(xiàn);從2000年到2006年已經(jīng)達(dá)到758篇文獻(xiàn)。筆者大致對2000年到2006年的758篇文獻(xiàn)進(jìn)行瀏覽,發(fā)現(xiàn)涉及的內(nèi)容非常廣泛,包括企業(yè)信息集成、數(shù)據(jù)庫集成、系統(tǒng)集成、網(wǎng)絡(luò)資源集成、各專業(yè)領(lǐng)域信息集成等?梢钥闯黾梢呀(jīng)成為數(shù)字圖書館建設(shè)的主旋律。
筆者用“aggregat*or integrat*”與digital library、documentation、resources進(jìn)行組配檢索,共檢索到51篇與文獻(xiàn)資源集成揭示相關(guān)的文獻(xiàn)。主要討論的問題有:紙本資源和電子資源集成揭示,電子資源的編目,各種類型電子資源的集成揭示和服務(wù),電子資源管理系統(tǒng),各類型資源的元數(shù)據(jù)集成等問題。例如:Janice Lewis Steed和Clark Nail的論文探討在圖書館構(gòu)建一個主題指南數(shù)據(jù)庫,包含所有格式的資源,作為用戶查找資源的入口,可以檢索到圖書館的所有的資源。Davies S和Wales A在論文中詳細(xì)介紹了英國NHS圖書館聯(lián)盟聯(lián)合的電子資源建設(shè)和集成虛擬圖書館建設(shè)工作。
筆者在維普中文科技期刊數(shù)據(jù)庫中,共檢索到200余篇與集成相關(guān)的論文,主要討論的是關(guān)于網(wǎng)絡(luò)信息資源整合、電子資源整合的技術(shù)、模式和方法等問題。理論和方法探討比較多,實踐研究的論文相對較少。
2 資源建設(shè)模式的轉(zhuǎn)變對文獻(xiàn)資源組織的影響
信息技術(shù)的發(fā)展,使信息的生產(chǎn)模式、供應(yīng)模式發(fā)生了巨大的變化。在新的信息供應(yīng)模式之上,建立全新的資源建設(shè)模式是資源整合化建設(shè)的主要內(nèi)容。隨著中科院國家科學(xué)圖書館的組建,需要逐步建立文獻(xiàn)資源整合化建設(shè)、集成化揭示新的業(yè)務(wù)模式。文獻(xiàn)資源整合化建設(shè)主要包括以下幾個方面內(nèi)容:
2.1 資源建設(shè)渠道的整合
隨著信息的生產(chǎn)模式、供應(yīng)模式的變化,資源的來源渠道也越來越多樣化。資源供應(yīng)渠道除了出版商和供應(yīng)商提供的資源之外,還包括開放獲取資源、第三方資源等。
2.2 資源載體的整合
多種載體資源的并行供應(yīng),使多載體資源的整合建設(shè)和集成揭示成為迫切的需要。比如就期刊資源建設(shè)而言,就有P+E模式、E-Only模式、P-Only模式、first+DDP模式。在這樣的資源建設(shè)狀況下,將出現(xiàn)紙本資源和電子資源共存,相互交叉和相互補充的狀況。
2.3 資源內(nèi)容的整合
中國科學(xué)院科研機構(gòu)具有地理位置分布廣,學(xué)科內(nèi)容相互交叉的特點。在進(jìn)行資源建設(shè)中,需要從資源學(xué)科內(nèi)容出發(fā),對中科院用戶的需求廣度、頻度、強度等進(jìn)行分析和評價,針對不同需求的資源,采用不同的購買和開通模式。比如,對于主要學(xué)科的檢索數(shù)據(jù)庫和綜合性核心全文數(shù)據(jù)庫,在全院有普遍性、經(jīng)常性需求,采取全院開通模式;對于面向?qū)W科領(lǐng)域的核心全文數(shù)據(jù)庫,在大學(xué)科領(lǐng)域有經(jīng)常性需求,采取按學(xué)科范圍在相關(guān)領(lǐng)域的研究所開通;對于數(shù)學(xué)、天文、空間技術(shù)、海洋、能源等學(xué)科的全文數(shù)據(jù)庫,在專門專業(yè)領(lǐng)域有經(jīng)常性需求,以相關(guān)專業(yè)研究所為核心的特色分館機制開通。
2.4 服務(wù)模式的整合
文獻(xiàn)資源的服務(wù)模式包括電子資源的即查即得、電子和紙本文獻(xiàn)的原文傳遞、圖書文獻(xiàn)的館際互借等。服務(wù)模式是資源建設(shè)的延伸和補充,資源建設(shè)需要與服務(wù)模式建設(shè)相結(jié)合,才能在有限的經(jīng)費情況下,最大限度地滿足用戶需求。
2.5 資源類型的整合
文獻(xiàn)信息資源包括全文數(shù)據(jù)庫、文摘數(shù)據(jù)庫、期刊、圖書、會議文獻(xiàn)、專利、研究生參考資料等。中科院是國家級科研機構(gòu)和國家科技人才的培養(yǎng)基地,用戶的類型多樣化,對文獻(xiàn)信息資源的需求也各不相同,因此從文獻(xiàn)資源類型出發(fā)的整合化建設(shè)也是文獻(xiàn)資源整合建設(shè)的一個重要方面。
綜上所述,通過中科院全院文獻(xiàn)資源的整合化建設(shè),將使全院文獻(xiàn)資源在內(nèi)容、類型、格式和地理位置等多緯度的分布更趨合理。在這樣一個資源布局下,需要對中科院全院文獻(xiàn)資源進(jìn)行集成化揭示,才能更有效地滿足全院用戶的個性化需求。
3 文獻(xiàn)資源集成揭示模式分析
由于集成揭示對象的不同、實現(xiàn)方式的不同以及達(dá)到集成揭示的目的和效果的不同,集成揭示可以有多種實現(xiàn)方式。下面從集成揭示的對象、集成揭示的方式和集成揭示的深度三個方面來對集成揭示系統(tǒng)進(jìn)行分析。
3.1 集成揭示的對象
從集成揭示的對象來看,可以分為單件(item)、集合(collection)和服務(wù)(service)。
?單件:表示一種圖書、一種期刊或一篇論文,對單件文獻(xiàn)集成的最常見的例子有圖書目錄、期刊目錄、期刊論文數(shù)據(jù)庫等,F(xiàn)在開始越來越多的集成目錄將多格式、對載體的文獻(xiàn)集成在一個目錄中,如中科院集成期刊目錄集成了電子期刊和印本期刊。
?集合:按照DCMI集合工作組的定義,集合是任何物理或數(shù)字對象的聚集。對集合進(jìn)行集成揭示的方式有:①建立集合目錄,也就是集合的集合,供用戶查找某個特定的集成,②用技術(shù)的方式實現(xiàn)集合的統(tǒng)一檢索,如跨庫檢索系統(tǒng)。③在對集合進(jìn)行統(tǒng)一的描述和揭示的基礎(chǔ)上,實現(xiàn)統(tǒng)一的檢索,如英國的IESR系統(tǒng)。
?服務(wù):表示數(shù)字圖書館提供的網(wǎng)絡(luò)服務(wù),一個服務(wù)可以包含一個或多個資源集合。對服務(wù)進(jìn)行集成的技術(shù)包括簡單的服務(wù)列表,W3C建立了一套完整技術(shù)體系,實現(xiàn)服務(wù)的集成,這套技術(shù)方法也可以應(yīng)用到數(shù)字圖書館服務(wù)集成上。
3.2 集成揭示的方式
集成揭示方式可以分為:
?集中式:將被揭示對象的元數(shù)據(jù)集中到一個物理數(shù)據(jù)庫中。
?虛擬式:實際上沒有一個物理的集中數(shù)據(jù)庫,只是在檢索時對多個系統(tǒng)進(jìn)行檢索,將形成臨時的集中檢索結(jié)果進(jìn)行顯示,例如常見的跨庫檢索機制。
?集中與虛擬相結(jié)合:這時各個分布系統(tǒng)有自己的揭示機制,但通過一定方式將這些分布系統(tǒng)的元數(shù)據(jù)收集到一個集中的揭示機制里,人們實際可以通過集中揭示機制來檢索 和獲取,也可以通過對具體的分布系統(tǒng)本身進(jìn)行檢索來獲取信息對象,例如OAI元數(shù)據(jù)搜索服務(wù)。
3.3 集成揭示的深度
從現(xiàn)在的實踐看,集成揭示深度至少體現(xiàn)在三方面:
?揭示信息(元數(shù)據(jù))豐富程度:即描述被揭示對象的元數(shù)據(jù)內(nèi)容是否豐富。
?揭示對象調(diào)用能力:是否可以通過在元數(shù)據(jù)中嵌套的標(biāo)識符(如DOI、OpenURL等)來靈活調(diào)用被揭示的信息對象。這個能力實際上還反映在多個方面,包括:能否直接調(diào)用信息對象,在調(diào)用中能否根據(jù)情景來判斷調(diào)用對象和調(diào)用方法。實現(xiàn)情景敏感的對象調(diào)度常用的是建立調(diào)度情景的知識庫,并結(jié)合OpenURL協(xié)議,實現(xiàn)根據(jù)用戶使用情景的目標(biāo)資源的動態(tài)調(diào)度。
?信息對象的關(guān)聯(lián)揭示能力:從一個信息對象,根據(jù)特定的關(guān)聯(lián)體系,用戶可以擴展到其他在知識內(nèi)容上相關(guān)的信息對象。實現(xiàn)從知識內(nèi)容方面的關(guān)聯(lián)的主要途徑是建立并應(yīng)用知識組織體系。知識組織體系不僅可以深入地揭示信息對象知識內(nèi)容,而且能揭示與這個信息對象在知識體系上相關(guān)的其他信息對象。
4 對中科院文獻(xiàn)資源集成揭示體系的思考
出版模式和資源建設(shè)模式轉(zhuǎn)變所帶來的影響是巨大的,文獻(xiàn)資源集成揭示體系建設(shè)已經(jīng)成為迫在眉睫的任務(wù)。下面從中科院文獻(xiàn)情報體系的結(jié)構(gòu)特點、用戶需求特點、資源建設(shè)模式特點和資源服務(wù)模式特點出發(fā),對中科院文獻(xiàn)資源集成揭示進(jìn)行總體規(guī)劃和設(shè)計。
中科院文獻(xiàn)資源集成揭示體系需要集成揭示科學(xué)院范圍的館藏印本資源、電子資源、開放獲取資源、第三方資源等可以用來為科研用戶提供信息服務(wù)的資源。
中科院集成揭示體系需要提供用戶靈活、高效、情景敏感的信息服務(wù),可以為用戶定制或選擇合適的目標(biāo)資源或服務(wù)。所以集成揭示體系在揭示文獻(xiàn)信息資源的同時,需要揭示非文獻(xiàn)類信息,如機構(gòu)信息,用戶信息;需要揭示各種信息的關(guān)聯(lián),比如全文電子期刊與全文電子數(shù)據(jù)庫的關(guān)聯(lián),機構(gòu)與開通信息的關(guān)聯(lián)等。
中科院集成揭示體系需要對揭示的信息對象進(jìn)行知識內(nèi)容的深度揭示和關(guān)聯(lián),使用戶可以從知識角度出發(fā)發(fā)現(xiàn)相關(guān)信息資源。
所以,中科院集成揭示體系建設(shè)可以從如下幾個方面進(jìn)行考慮:
4.1 中科院文獻(xiàn)資源集成揭示的范圍
首先,中科院文獻(xiàn)情報系統(tǒng)由國家科學(xué)圖書館和近百個研究所圖書館組成,是一個業(yè)務(wù)上由國家科學(xué)圖書館統(tǒng)一領(lǐng)導(dǎo)的圖書館聯(lián)盟。中科院文獻(xiàn)情報系統(tǒng)的資源和服務(wù)的整合為中科院全院的科研創(chuàng)新提供文獻(xiàn)信息資源服務(wù)。所以中科院文獻(xiàn)資源集成揭示在范圍上要包括科學(xué)院各研究所圖書館收藏的印本文獻(xiàn)資源和電子信息資源。
其次,中國科學(xué)院國家科學(xué)圖書館是國家科技圖書文獻(xiàn)中心的有機組成部分,國家科技圖書文獻(xiàn)中心的資源作為全國范圍共享的資源,是可以提供全院科研人員使用的。所以,國家科技圖書文獻(xiàn)中心的資源也需要在集成揭示系統(tǒng)中加以揭示。
另外,開放獲取資源和友好合作單位的資源可以作為全院文獻(xiàn)資源的補充,也是提供用戶服務(wù)的重要資源,集成揭示系統(tǒng)中也需要揭示這部分資源。
4.2 中科院文獻(xiàn)資源集成揭示的對象
從多年文獻(xiàn)資源建設(shè)成果來看,目前需要集成揭示的資源包括:
?館藏印本資源:包括印本的中外文圖書、印本的中外文期刊、學(xué)位論文等。
?全文電子資源:包括全文電子期刊、全文電子圖書。
?電子數(shù)據(jù)庫:除全文數(shù)據(jù)庫外,還有大量的檢索類數(shù)據(jù)庫需要集成,如劍橋科學(xué)文摘數(shù)據(jù)庫。
?內(nèi)部資源:在科研過程中產(chǎn)生的大量的灰色文獻(xiàn),比如研究報告、項目報告、技術(shù)報告等,這些灰色文獻(xiàn)是非常有價值的文獻(xiàn)信息資源,也是需要加以揭示,并在一定的授權(quán)范圍內(nèi)提供使用的。
4.3 中科院文獻(xiàn)資源集成揭示的信息類型
為達(dá)到提供用戶集成的文獻(xiàn)信息服務(wù)的目標(biāo),筆者將文獻(xiàn)信息資源集成揭示體系中需要揭示的信息分四個類型:信息對象的元數(shù)據(jù)描述、館藏信息和開通信息、服務(wù)管理型信息、資源關(guān)聯(lián)和組織型資源。
?信息對象的元數(shù)據(jù)信息:對信息對象的屬性的描述與揭示,提供用戶發(fā)現(xiàn)特定的文獻(xiàn)信息,包括印本文獻(xiàn)、電子文獻(xiàn)的元數(shù)據(jù)信息,如學(xué)位論文元數(shù)據(jù)等。
?館藏信息和開通信息:館藏信息是指印本文獻(xiàn)的收藏單位,館藏信息即可以為單個圖書館文獻(xiàn)借閱提供信息,也可以服務(wù)于館際互借和原文傳遞。電子資源的開通信息即可以作為用戶直接獲取電子文獻(xiàn)提供服務(wù),也相當(dāng)于印本的館藏信息,可以提供原文傳遞服務(wù)。
?服務(wù)管理型信息:服務(wù)管理型信息包括用戶的信息,如用戶識別號、姓名、用戶類別、所在機構(gòu),機構(gòu)信息,如機構(gòu)名稱,IP地址等。這些信息雖然不是直接為用戶服務(wù)的文獻(xiàn)信息,但在整個集成揭示系統(tǒng)中具有重要的作用。館際互借和原文傳遞系統(tǒng)、聯(lián)合目錄系統(tǒng)、情景敏感的集成期刊目錄系統(tǒng)都離不開這些信息的支持。
?信息對象關(guān)聯(lián)和組織型資源:包括知識組織體系和規(guī)范體系。知識組織體系從知識內(nèi)容出發(fā)將相關(guān)資源集成到一起,規(guī)范體系從名稱角度,將同一創(chuàng)建者的信息對象集成到一起。雖然在元數(shù)據(jù)描述中已包含了一部分信息資源間的關(guān)聯(lián),但從知識內(nèi)容和信息的創(chuàng)建者出發(fā)進(jìn)行的關(guān)聯(lián)與集成是集成揭示體系建設(shè)的重要內(nèi)容。
5 中科院國家科學(xué)圖書館集成揭示系統(tǒng)的實施策略
5.1 文獻(xiàn)資源集成服務(wù)系統(tǒng)目標(biāo)情景描述
文獻(xiàn)資源集成揭示體系建設(shè)的目標(biāo)是提供用戶集成的信息檢索和獲取服務(wù)。集成服務(wù)系統(tǒng)要達(dá)到的目標(biāo)服務(wù)情景描述如下:
5.1.1 集成檢索提供用戶對圖書、期刊、期刊論文、學(xué)位論文、網(wǎng)絡(luò)資源、研究報告等各類文獻(xiàn)的檢索。集成檢索系統(tǒng)根據(jù)用戶的檢索請求,需要調(diào)用各種不同的數(shù)據(jù)庫,比如檢索圖書需要調(diào)用聯(lián)合目錄數(shù)據(jù)庫,檢索西文期刊論文可以調(diào)用國家科技圖書文獻(xiàn)中心的期刊論文數(shù)據(jù)庫。支持集成檢索的數(shù)據(jù)庫可以是本地的,也可以是遠(yuǎn)程的;可以是自建的,也可以是購買的、第三方資源或開放獲取資源。集成檢索系統(tǒng)應(yīng)用跨庫檢索系統(tǒng),可以實現(xiàn)對多個數(shù)據(jù)庫的統(tǒng)一檢索。
5.1.2 根據(jù)情景,提供用戶最合適的資源和服務(wù)檢索系統(tǒng)查詢到用戶需要的資源后,可以根據(jù)用戶身份和權(quán)限、資源的狀況,提供用戶獲取資源的最佳方式。比如用戶檢索期刊論文,系統(tǒng)可以根據(jù)用戶身份判斷該用戶是否具有對某個全文期刊的獲取權(quán)限,如果用戶有全文獲取權(quán)限,首先提供用戶全文連接地址。如果用戶沒有全文可以獲取,系統(tǒng)自動判斷用戶所在單位是否定購該期刊,該期刊是否到館,如果是,可以告訴用戶直接到所在單位的圖書館借閱。如果用戶所在單位沒有收藏此期刊,可以提示用戶是否需要原文傳遞,用戶可以直接提交原文傳遞請求。
5.1.3 資源間的關(guān)聯(lián)用戶檢索到目標(biāo)資源后,可以通過各種關(guān)聯(lián)機制,繼續(xù)查詢相關(guān)資源。比如根據(jù)元數(shù)據(jù)中的相關(guān)資源描述,根據(jù)知識組織體系的關(guān)聯(lián)等。
5.1.4 實現(xiàn)與外部系統(tǒng)的集成集成揭示系統(tǒng)提供多種接口,實現(xiàn)從外部系統(tǒng)到集成系統(tǒng)的連接。主要應(yīng)提供的接口有: Web服務(wù)接口、Z39.50協(xié)議接口、open接口、唯一標(biāo)識符接口等。系統(tǒng)可以實現(xiàn)的連接包括從搜索引擎到集成服務(wù)系統(tǒng)的連接,從商業(yè)數(shù)據(jù)庫到集成服務(wù)系統(tǒng)的連接,從友好合作單位的連接服務(wù)器到集成服務(wù)系統(tǒng)的連接等。
圖1是集成檢索系統(tǒng)服務(wù)流程示意圖,實線表示用戶流程,虛線表示系統(tǒng)流程。
5.2中科院集成揭示體系建設(shè)的實施步驟和策略
5.2.1 基本文獻(xiàn)資源的集成揭示體系建設(shè)建設(shè)全院統(tǒng)一的文獻(xiàn)資源揭示系統(tǒng),用一個統(tǒng)一的系統(tǒng),實現(xiàn)全院所有單位的資源的揭示和服務(wù)。公共揭示系統(tǒng)應(yīng)達(dá)到如下目標(biāo):實現(xiàn)單個圖書館自動化系統(tǒng)的采購、編目、期刊收登、流通等所有工作,實現(xiàn)電子資源和印本資源的統(tǒng)一和集中的揭示,實現(xiàn)全院的采購信息、書目信息、館藏信息、簽到信息、流通數(shù)據(jù)、讀者信息的集中統(tǒng)一管理;通過特殊的聯(lián)盟機制,實現(xiàn)全院集成檢索服務(wù)、館際互借和原文傳遞服務(wù)、統(tǒng)一采購服務(wù);在這樣一個系統(tǒng)上,實現(xiàn)全院范圍的全面和規(guī)范的文獻(xiàn)資源利用的統(tǒng)計分析。
5.2.2 灰色資源的集成揭示體系建設(shè) 中科院每年在科研過程中會產(chǎn)生大量的非正式出版的文獻(xiàn)資源,比如項目開題和結(jié)題報告、非正式發(fā)表的論文、非正式出版的會議論文、博碩士論文、博士后研究報告等。另外,對于大量的非文獻(xiàn)類信息,如科研儀器和設(shè)備、科研試劑、實驗動物、標(biāo)本、科研數(shù)據(jù)、科研人員和科研機構(gòu)、科研動態(tài)、科研新聞等,這些信息是科研人員在科研過程中非常需要的信息資源,也是需要進(jìn)行揭示并提供科研人員的查詢服務(wù)的;疑Y源的揭示又可以分三個部分:①博碩士論文數(shù)據(jù)庫。收錄科學(xué)院全院的博碩士研究生的畢業(yè)論文、博士后研究報告的電子版全文,在合理的版權(quán)保護(hù)和使用制度下,提供全院范圍的服務(wù)。②機構(gòu)倉儲。建立機構(gòu)倉儲系統(tǒng)保存機構(gòu)內(nèi)部的非正式發(fā)表的論文、研究報告,并在一定的條件和范圍內(nèi)提供服務(wù)。③非文獻(xiàn)類信息的組織和揭示。使用本體技術(shù)和語義門戶技術(shù),組織和揭示包括科研儀器設(shè)備、科研人員和機構(gòu)等在內(nèi)的非文獻(xiàn)類信息。
5.2.3 規(guī)范體系建設(shè)建立聯(lián)機聯(lián)合加工的規(guī)范數(shù)據(jù)庫,實現(xiàn)全院范圍的聯(lián)合的規(guī)范數(shù)據(jù)庫建設(shè)和維護(hù)更新。規(guī)范庫應(yīng)用于全院各種類型資源加工的規(guī)范,通過規(guī)范數(shù)據(jù)庫實現(xiàn)集成服務(wù)系統(tǒng)中資源間的鏈接和統(tǒng)一檢索。
5.2.4 知識組織體系建設(shè) 由于目前國家科學(xué)數(shù)字圖書館提供用戶的資源類型廣泛,各種資源依據(jù)的知識組織體系各不相同,建設(shè)集成的知識組織體系,可以實現(xiàn)從學(xué)科體系出發(fā)對多種資源的集成揭示和檢索。可以仿照歐洲Renardus項目的經(jīng)驗,選取一個核心的知識組織體系,通過映射的方法,將其他知識組織體系集成到核心的知識組織體系之下。
相關(guān)熱詞搜索:揭示 文獻(xiàn) 思路 文獻(xiàn)資源集成揭示的思路與實踐 宋文作 宋文驄
熱點文章閱讀