- 相關(guān)推薦
學(xué)科信息門戶中網(wǎng)絡(luò)信息導(dǎo)航系統(tǒng)的規(guī)范建設(shè)
學(xué)科信息門戶中網(wǎng)絡(luò)信息導(dǎo)航系統(tǒng)的規(guī)范建設(shè)【內(nèi)容提要】根據(jù)國(guó)家科學(xué)數(shù)字圖書(shū)館(CSDL)分布式學(xué)科信息門戶及其學(xué)科信息導(dǎo)航系統(tǒng)建設(shè)的總體要求,描述了學(xué)科信息導(dǎo)航系統(tǒng)中資源選擇、資源搜尋策略、元數(shù)據(jù)、知識(shí)組織體系、維護(hù)使用管理機(jī)制等的設(shè)計(jì)規(guī)范及其開(kāi)放描述要求。
【摘 要 題】信息資源建設(shè)
【關(guān) 鍵 詞】國(guó)家科學(xué)數(shù)字圖書(shū)館/學(xué)科信息門戶/學(xué)科信息導(dǎo)航/設(shè)計(jì)規(guī)范
中國(guó)科學(xué)院國(guó)家科學(xué)數(shù)字圖書(shū)館(CSDL)工程的一個(gè)重要任務(wù)是建立權(quán)威、可靠的學(xué)科信息門戶體系。本文首先簡(jiǎn)要分析學(xué)科信息門戶的基本形態(tài)和CSDL學(xué)科信息門戶建設(shè)要求,然后介紹CSDL學(xué)科信息門戶中網(wǎng)絡(luò)信息導(dǎo)航系統(tǒng)的選擇規(guī)則、搜尋策略、內(nèi)容描述機(jī)制、組織體系描述機(jī)制、組織管理機(jī)制的設(shè)計(jì)規(guī)范及其開(kāi)放描述要求。
1 學(xué)科信息門戶形態(tài)
學(xué)科信息門戶致力于將特定學(xué)科領(lǐng)域的信息資源、工具與服務(wù)集成到一個(gè)整體中,為用戶提供一個(gè)方便的信息檢索和服務(wù)入口。學(xué)科信息門戶經(jīng)歷了不斷發(fā)展和深化的若干形式:
。1)以網(wǎng)絡(luò)學(xué)科信息導(dǎo)航為主的學(xué)科信息門戶,提供權(quán)威、可靠、規(guī)范和可持續(xù)的網(wǎng)絡(luò)信息資源選擇、描述和檢索[1-3],例如SOGIG(http://www.sosig.ac.uk/)、AHDS(http://www.ahds.ac.uk/)、Biz/ed(http://www.bized.ac.uk/)、EELS(http://eels.lub. lu.se/)、GeoGuide(http://www.geo-guide.de/)、MathGuide (http://www.mathguide.de/)、Martindale's Reference Desk(http: //www-sci.lib.uci.edu/HSG/Ref.html)、OMNI(http://www.omni.ac. uk/)、WWWVirtual Library(http://www.vlib.org/Overview. html)等,成為相關(guān)學(xué)科領(lǐng)域的核心和可信賴的信息門戶。
。2)以專業(yè)機(jī)構(gòu)或圖書(shū)情報(bào)服務(wù)系統(tǒng)為基礎(chǔ)的信息門戶, 根據(jù)專業(yè)機(jī)構(gòu)性質(zhì)或其信息服務(wù)要求,將各類資源(包括網(wǎng)絡(luò)資源、數(shù)據(jù)庫(kù)、文件系統(tǒng)、知識(shí)庫(kù)、指南手冊(cè)等)組合在統(tǒng)一門戶下向用戶提供服務(wù),其中部分門戶可支持橫向整合檢索、參考文獻(xiàn)鏈接、用戶虛擬社區(qū)等功能。
。3)基于跨學(xué)科門戶檢索的學(xué)科門戶體系, 支持多個(gè)學(xué)科信息門戶之間的整合檢索,例如CrossRoads[4]、Issac Network[5]、Imesh[6]、ELT[7]系統(tǒng)。
(4)基于門戶體系的數(shù)字信息服務(wù)機(jī)制, 將多個(gè)分布門戶(主要是學(xué)科信息門戶)作為整個(gè)數(shù)字信息資源的整合機(jī)制和服務(wù)渠道,讓用戶通過(guò)門戶體系方便地搜尋、調(diào)用和利用各種不同的信息資源和服務(wù),例如英國(guó)JICS的Distributed National Electronic Resources (DNER)[8]和美國(guó)NSF的National SMETE Digital Library(NSDL)[9]。
。5)開(kāi)放數(shù)字信息服務(wù)機(jī)制, 不但支持基于學(xué)科信息門戶的資源與服務(wù)集成,還進(jìn)一步支持按照用戶個(gè)性化需要定制信息門戶,根據(jù)邏輯業(yè)務(wù)流程整合多個(gè)信息服務(wù)環(huán)節(jié),支持多個(gè)信息門戶之間的開(kāi)放集成與定制[10],這方面的技術(shù)包括Open Digital Libraries、OpenLinking和Open Metadata機(jī)制,而且基于分布Web 服務(wù)的開(kāi)放電子商務(wù)關(guān)鍵技術(shù)(ebXML[11]體系和Web Services[12 ]機(jī)制)也可在開(kāi)放學(xué)科信息門戶中得到應(yīng)用。
通過(guò)這些努力,可以通過(guò)學(xué)科信息門戶來(lái)邏輯地靈活地整合、可靠地組織、無(wú)縫地鏈接用戶所需的信息資源和信息服務(wù),并支持用戶在它們基礎(chǔ)上的個(gè)性化集成定制,從而將一個(gè)分布和紛雜的信息空間組織成一個(gè)方便的用戶信息系統(tǒng)。
2 CSDL學(xué)科信息門戶建設(shè)
CSDL將從開(kāi)放數(shù)字信息服務(wù)機(jī)制出發(fā),建立多個(gè)分布的學(xué)科信息門戶網(wǎng)站,提供權(quán)威和可靠的學(xué)科信息導(dǎo)航,整合學(xué)科信息資源與服務(wù)系統(tǒng),并逐步支持開(kāi)放式集成定制。具體地:
。1)提供學(xué)科信息導(dǎo)航:針對(duì)專業(yè)研究型用戶的需要, 建立可靠覆蓋國(guó)內(nèi)外本學(xué)科的權(quán)威的專業(yè)信息資源的規(guī)范導(dǎo)航系統(tǒng),采取標(biāo)準(zhǔn)元數(shù)據(jù)來(lái)深入描述信息資源,采取規(guī)范知識(shí)組織體系對(duì)所收集資源進(jìn)行組織,提供多層次信息檢索和瀏覽功能,支持分布式信息資源選擇、描述和組織,支持定期數(shù)據(jù)自動(dòng)檢驗(yàn)和計(jì)算機(jī)輔助更新。
。2 )實(shí)現(xiàn)學(xué)科信息橫向整合:在學(xué)科信息門戶內(nèi)橫向整合本學(xué)科領(lǐng)域的各種文獻(xiàn)信息資源系統(tǒng)(包括二次文獻(xiàn)數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)、聯(lián)合目錄、館藏目錄、館際互借和全文傳遞等相關(guān)服務(wù)系統(tǒng)),提供分布資源的集成界面,并逐步實(shí)現(xiàn)同構(gòu)和異構(gòu)數(shù)據(jù)庫(kù)的整合檢索。
。3 )實(shí)現(xiàn)學(xué)科信息縱向整合:在學(xué)科信息門戶內(nèi)縱向整合本學(xué)科領(lǐng)域的各種文獻(xiàn)信息服務(wù)過(guò)程(包括文獻(xiàn)檢索、全文獲取、館藏資源獲取、資料傳遞、數(shù)字參考咨詢服務(wù)、個(gè)性化集成定制、SDI服務(wù)、 用戶協(xié)作交流服務(wù)等),按照用戶信息檢索與利用流程實(shí)現(xiàn)各個(gè)資源與服務(wù)系統(tǒng)間的無(wú)縫鏈接。
。4 )支持開(kāi)放集成定制:通過(guò)規(guī)范元數(shù)據(jù)來(lái)描述學(xué)科信息門戶的資源對(duì)象、知識(shí)組織體系、管理機(jī)制、檢索與瀏覽機(jī)制、系統(tǒng)信息架構(gòu)等各層數(shù)據(jù),通過(guò)開(kāi)放語(yǔ)言實(shí)現(xiàn)描述數(shù)據(jù)的規(guī)范標(biāo)記,通過(guò)開(kāi)放搜尋機(jī)制支持對(duì)這些描述數(shù)據(jù)的發(fā)現(xiàn)和解析以及對(duì)學(xué)科信息門戶的發(fā)現(xiàn)、解析和重組,從而支持個(gè)性化定制和開(kāi)放式集成。
CSDL將通過(guò)有效的學(xué)科信息門戶,將分布的數(shù)字信息資源和信息服務(wù)集成到用戶桌面,并通過(guò)開(kāi)放描述機(jī)制和分布Web 服務(wù)機(jī)制來(lái)支持對(duì)各門戶及其內(nèi)容的個(gè)性化定制與集成。
3 學(xué)科信息門戶中的網(wǎng)絡(luò)信息導(dǎo)航
CSDL學(xué)科信息門戶中的學(xué)科信息導(dǎo)航系統(tǒng)指具有嚴(yán)格質(zhì)量控制、提供規(guī)范和深入的知識(shí)化描述、支持集成與定制的可靠的網(wǎng)絡(luò)信息資源組織和檢索系統(tǒng)。它們?cè)趨f(xié)調(diào)一致的設(shè)計(jì)
規(guī)范和開(kāi)放描述原則基礎(chǔ)上,針對(duì)本專業(yè)研究型用戶所需要的網(wǎng)絡(luò)信息資源(包括網(wǎng)站、圖書(shū)情報(bào)系統(tǒng)、文摘索引、電子期刊、科技報(bào)告、學(xué)位與會(huì)議論文、研究機(jī)構(gòu)、學(xué)術(shù)團(tuán)體、教育機(jī)構(gòu)、學(xué)術(shù)會(huì)議、工具書(shū)、專業(yè)服務(wù)系統(tǒng)以及與學(xué)科科研緊密相關(guān)的其他資源系統(tǒng)),根據(jù)可靠的評(píng)價(jià)選擇規(guī)則、搜尋搜集策略、規(guī)范組織標(biāo)引機(jī)制、檢索瀏覽機(jī)制和維護(hù)使用管理機(jī)制等,建立起可靠覆蓋本領(lǐng)域核心資源、基本覆蓋本領(lǐng)域其他主要資源、選擇性覆蓋相關(guān)學(xué)科核心資源、與其他學(xué)科信息門戶有機(jī)鏈接的網(wǎng)絡(luò)化資源與服務(wù)組織體系,并支持用戶系統(tǒng)或其他學(xué)科信息門戶對(duì)自己信息的搜尋、集成。
這樣的學(xué)科信息門戶一般具有以下特點(diǎn):專業(yè)性,針對(duì)限定的專業(yè)領(lǐng)域,主要針對(duì)學(xué)術(shù)研究信息和教育科研用戶;集成性,把專業(yè)領(lǐng)域所需要的各種資源與服務(wù)凝聚到一個(gè)知識(shí)體系中;知識(shí)性,根據(jù)對(duì)知識(shí)內(nèi)容及其關(guān)系的分析來(lái)選擇、描述和組織資源和服務(wù),例如按照嚴(yán)格的評(píng)價(jià)規(guī)則,由信息專家和學(xué)科專家選擇信息資源,按照標(biāo)準(zhǔn)元數(shù)據(jù)格式和標(biāo)準(zhǔn)詞表進(jìn)行著錄和標(biāo)引,按照規(guī)范知識(shí)組織體系(如分類法)進(jìn)行組織;智能性,提供符合專業(yè)領(lǐng)域特征的檢索瀏覽方式,并可在專業(yè)知識(shí)組織體系(詞表、分類法等)支持下優(yōu)化瀏覽和檢索,而且可與語(yǔ)義門戶(Semantic Web)結(jié)合提供智能化資源檢索和結(jié)果整合功能;可靠性,通過(guò)嚴(yán)格選擇、規(guī)范描述和持續(xù)的校驗(yàn)與更新,保障導(dǎo)航信息的可靠性和整個(gè)組織與描述機(jī)制的可靠性。
為實(shí)現(xiàn)上述要求,學(xué)科信息導(dǎo)航系統(tǒng)依靠一系列規(guī)范機(jī)制來(lái)保障其有效性和可靠性,例如資源選擇規(guī)則、資源搜尋策略、資源元數(shù)據(jù)描述規(guī)范、知識(shí)組織體系規(guī)范、使用管理機(jī)制規(guī)范、分布式組織管理規(guī)范等。通過(guò)這些規(guī)范,學(xué)科信息門戶可以準(zhǔn)確定義和描述自己的要求與運(yùn)行機(jī)制,用戶可以了解和信賴學(xué)科導(dǎo)航信息系統(tǒng),其他系統(tǒng)也可以通過(guò)這些規(guī)范的開(kāi)放描述來(lái)實(shí)現(xiàn)集成與定制。
4 資源選擇和資源搜尋控制
嚴(yán)格的資源選擇是學(xué)科信息導(dǎo)航系統(tǒng)知識(shí)性可靠性的關(guān)鍵保障之一,它的實(shí)現(xiàn)依靠嚴(yán)格的標(biāo)準(zhǔn)設(shè)計(jì)、規(guī)范定義和流程控制[2.13-16],至少涉及以下問(wèn)題:
。1)資源選擇標(biāo)準(zhǔn)。 它幫助工作人員明確理解對(duì)資源范圍和質(zhì)量的要求,幫助用戶理解和信任它的質(zhì)量控制標(biāo)準(zhǔn)并在此基礎(chǔ)上幫助用戶判斷通過(guò)它所獲得的信息的質(zhì)量,促進(jìn)分布運(yùn)營(yíng)機(jī)制下資源選擇的一致性,幫助訓(xùn)練新的資源選擇人員。資源選擇評(píng)價(jià)標(biāo)準(zhǔn)應(yīng)盡可能地可操作,其中某些可量化。
資源選擇標(biāo)準(zhǔn)涉及資源范圍標(biāo)準(zhǔn)、資源質(zhì)量標(biāo)準(zhǔn)和資源評(píng)價(jià)標(biāo)準(zhǔn)。其中:
●資源范圍標(biāo)準(zhǔn),規(guī)定什么資源可被收集組織到學(xué)科信息門戶,主要涉及:a.信息內(nèi)容,例如主題范圍和可接受的資源類型、資源來(lái)源、內(nèi)容深度、內(nèi)容權(quán)威性、內(nèi)容新穎性、商業(yè)化程度等;b.接入條件,例如可接受的付費(fèi)條件、技術(shù)條件、注冊(cè)要求、殘障人利用條件等;c.細(xì)粒度要求,指資源對(duì)象應(yīng)該達(dá)到的信息內(nèi)容詳細(xì)程度;d.元數(shù)據(jù)要求,指資源的地理與語(yǔ)言范圍等。
●資源質(zhì)量標(biāo)準(zhǔn),規(guī)定被選擇資源需達(dá)到的基本質(zhì)量,主要包括:a.內(nèi)容標(biāo)準(zhǔn),包括有效性、權(quán)威性、實(shí)質(zhì)性、準(zhǔn)確性、全面性、唯一性、資源結(jié)構(gòu)組織、及時(shí)性以及資源維護(hù)程度;b.形式標(biāo)準(zhǔn),包括瀏覽方便性、用戶支持、標(biāo)準(zhǔn)化程度、美觀程度;c.處理標(biāo)準(zhǔn),涉及信息完整性、站點(diǎn)完整性、系統(tǒng)完整性等。
●資源評(píng)價(jià)標(biāo)準(zhǔn),用于規(guī)范化地描述選擇人員對(duì)資源的評(píng)價(jià)意見(jiàn),資源評(píng)價(jià)應(yīng)按照前述選擇標(biāo)準(zhǔn)從多層面描述評(píng)價(jià)結(jié)果,應(yīng)能確定評(píng)價(jià)人及其評(píng)價(jià)資格,應(yīng)使用標(biāo)準(zhǔn)語(yǔ)言進(jìn)行描述,還可使用特定標(biāo)記方式(例如星級(jí)標(biāo)記)來(lái)簡(jiǎn)要表示評(píng)價(jià)結(jié)果,并作為元數(shù)據(jù)的一部分被存儲(chǔ)和支持檢索,評(píng)價(jià)信息可被寫(xiě)入資源描述摘要中。
。2)資源選擇流程規(guī)范。 一個(gè)具有一定規(guī)模的學(xué)科信息導(dǎo)航系統(tǒng)往往有多個(gè)專家參與資源的選擇評(píng)鑒,需要有嚴(yán)格的規(guī)范來(lái)保證選擇過(guò)程的一致性。資源選擇流程規(guī)范規(guī)定由什么人、按照什么標(biāo)準(zhǔn)和什么步驟、對(duì)什么方面的資源進(jìn)行選擇評(píng)價(jià),以及如何處理選擇評(píng)價(jià)結(jié)果。具體地,這個(gè)規(guī)范包括資源選擇標(biāo)準(zhǔn)、資源選擇流程步驟、選擇人員標(biāo)準(zhǔn)、選擇人員描述格式(以便選擇過(guò)程中的推薦、指向和咨詢)、選擇人員分工組織規(guī)定、選擇結(jié)果描述方式、選擇信息交換格式(支持協(xié)作選擇描述),還可規(guī)定是否接受用戶推薦資源、接收程序以及對(duì)推薦資源的審查和回復(fù)程序等。
。3)資源搜尋控制。 學(xué)科信息導(dǎo)航系統(tǒng)需要嚴(yán)謹(jǐn)?shù)馁Y源搜尋控制機(jī)制和相應(yīng)的搜尋規(guī)范來(lái)界定搜尋范圍、過(guò)濾搜尋資源、協(xié)調(diào)搜尋操作過(guò)程,保障在有限的分布的人力下對(duì)高質(zhì)量信息資源進(jìn)行完整、及時(shí)、持續(xù)的搜尋,保證搜尋的有效性、一致性和連續(xù)性。資源搜尋過(guò)程需要規(guī)定搜尋途徑和方式(即通過(guò)哪些途徑和方式來(lái)搜尋和跟蹤哪些資源)、建立和維護(hù)搜尋對(duì)象目錄、分配搜尋責(zé)任、確定搜尋時(shí)序、確定資源智能過(guò)濾規(guī)則、確定資源搜尋中元數(shù)據(jù)挖掘與轉(zhuǎn)換機(jī)制、確定推薦資源審查規(guī)則、確定與其他學(xué)科信息導(dǎo)航系統(tǒng)的合作搜尋機(jī)制等。
所謂合作搜尋機(jī)制,指覆蓋領(lǐng)域相互交叉的學(xué)科信息導(dǎo)航系統(tǒng)間合作搜尋和共享元數(shù)據(jù)的方法,例如:a.不同導(dǎo)航系統(tǒng)分工負(fù)責(zé)交叉領(lǐng)域里不同主題范圍的資源組織,在各自知識(shí)組織體系中都包含這些主題范圍,通過(guò)直接鏈接對(duì)方資源元數(shù)據(jù)來(lái)相互利用各自的資源內(nèi)容。b.不同導(dǎo)航系統(tǒng)分工負(fù)責(zé)不同主題范圍的資源組織,相互交換和復(fù)用交叉主題范圍的資源元數(shù)據(jù),所交換的元數(shù)據(jù)往往由接收方導(dǎo)航系統(tǒng)進(jìn)行再標(biāo)引再組織,從而共同(往往各有側(cè)重地)提供交叉領(lǐng)域的資源檢索。無(wú)論什么情況,都需要商定分工搜尋范圍、數(shù)據(jù)格式,并遵守共同的質(zhì)量控制和著錄原則。
5 資源元數(shù)據(jù)描述
學(xué)科信息導(dǎo)航系統(tǒng)涉及的描述信息包括資源對(duì)象、知識(shí)組織體系、使用管理機(jī)制、檢索與瀏覽機(jī)制等層次,通過(guò)開(kāi)放語(yǔ)言和規(guī)范方式對(duì)這些層次進(jìn)行描述都構(gòu)成元數(shù)據(jù)[17],成為導(dǎo)航系統(tǒng)元數(shù)據(jù)體系的一部分。高質(zhì)量的元數(shù)據(jù)描述是學(xué)科信息導(dǎo)航系統(tǒng)知識(shí)性可靠性的又一關(guān)鍵保障,也需要一系列的描述規(guī)范和過(guò)程規(guī)范來(lái)定義和控制。本節(jié)主要討論對(duì)資源對(duì)象進(jìn)行描述的元數(shù)據(jù),包括以下內(nèi)容:
。1)元數(shù)據(jù)規(guī)范。元數(shù)據(jù)規(guī)范對(duì)元數(shù)據(jù)元素、 子元素及可能的限制屬性進(jìn)行規(guī)定。資源元數(shù)據(jù)涉及內(nèi)容和管理兩方面。內(nèi)容元數(shù)據(jù)對(duì)資源本身進(jìn)行描述,建議采用通用的或標(biāo)準(zhǔn)的元數(shù)據(jù)格式,采用規(guī)范擴(kuò)展方式復(fù)用其他標(biāo)準(zhǔn)元數(shù)據(jù)格式的相關(guān)元素來(lái)描述復(fù)雜資源對(duì)象,并通過(guò)XML Namespace方式建立與元數(shù)據(jù)格式定義文件的鏈接。 例如對(duì)一個(gè)課件資源,可采用Dublin Core[18]描述基本屬性,復(fù)用IEEE LOM [19]相關(guān)元素來(lái)描述與教學(xué)有關(guān)的屬性。管理元數(shù)據(jù)用于描述資源著錄過(guò)程及其控制,一般不顯示給用戶,可被智能代理用于自動(dòng)控制某些操作?赡艿墓芾碓獢(shù)據(jù)元素包括維護(hù)者、上次搜尋日期、上次元數(shù)據(jù)更新日期、上次資源變動(dòng)日期、預(yù)計(jì)資源重新審定日期、資源失效日期(例如會(huì)議信息)、元數(shù)據(jù)著錄者等。管理元數(shù)據(jù)可以與內(nèi)容元數(shù)據(jù)捆綁在一起,但也可單獨(dú)通過(guò)一定唯一標(biāo)識(shí)符與內(nèi)容元數(shù)據(jù)鏈接,可支持內(nèi)
容元數(shù)據(jù)的復(fù)用。管理元數(shù)據(jù)也應(yīng)采用標(biāo)準(zhǔn)格式和標(biāo)準(zhǔn)擴(kuò)展方式。
。2)元數(shù)據(jù)著錄規(guī)范及其他控制規(guī)范[20-22]。由于資源元數(shù)據(jù)可能來(lái)自多個(gè)途徑(例如資源系統(tǒng)本身、用戶、資源選擇人員、資源著錄人員、其他學(xué)科信息門戶、自動(dòng)挖掘等),它們對(duì)元數(shù)據(jù)內(nèi)容的描述方式可能有很大差異,需要通過(guò)著錄規(guī)范來(lái)具體規(guī)定如何進(jìn)行元數(shù)據(jù)描述。規(guī)定內(nèi)容包括:a.元數(shù)據(jù)內(nèi)容編碼規(guī)范,例如關(guān)于日期、語(yǔ)言、各種名稱代碼、主題詞來(lái)源、分類表來(lái)源、評(píng)價(jià)等級(jí)等的標(biāo)準(zhǔn)表達(dá)方式或最佳實(shí)踐(Best Practices)。有關(guān)標(biāo)準(zhǔn)可用計(jì)算機(jī)可識(shí)別方式組織,以利著錄過(guò)程中進(jìn)行查詢和自動(dòng)檢驗(yàn)。b.元數(shù)據(jù)元素、子元素或限定屬性的選擇方式。c.主題詞、分類號(hào)選擇標(biāo)引原則和方式,這時(shí)將利用分類標(biāo)引規(guī)范。d.文字描述內(nèi)容(尤其是摘要、評(píng)價(jià)意見(jiàn)等)的撰寫(xiě)規(guī)范,例如摘要來(lái)源、摘要長(zhǎng)度、客觀性、語(yǔ)言風(fēng)格、署名等要求。這些著錄規(guī)范被稱為Application Profiles。
除了著錄規(guī)范外,元數(shù)據(jù)檢驗(yàn)規(guī)范可規(guī)定如何檢驗(yàn)元數(shù)據(jù)的正確性,元數(shù)據(jù)轉(zhuǎn)換規(guī)范支持對(duì)資源內(nèi)含元數(shù)據(jù)或其他學(xué)科信息門戶交換元數(shù)據(jù)進(jìn)行轉(zhuǎn)換的方法,元數(shù)據(jù)挖掘規(guī)范支持根據(jù)資源內(nèi)容自動(dòng)析取元數(shù)據(jù)元素內(nèi)容。
元數(shù)據(jù)描述過(guò)程規(guī)范將規(guī)定元數(shù)據(jù)描述的任務(wù)、程序、相應(yīng)規(guī)范、有關(guān)審核控制機(jī)制(形成可靠的工作流),并可用開(kāi)放語(yǔ)言進(jìn)行描述而生成工作流元數(shù)據(jù),成為元數(shù)據(jù)描述的工作流管理的基礎(chǔ)。
。3)主題與分類描述規(guī)范。 對(duì)資源內(nèi)容按照標(biāo)準(zhǔn)詞表進(jìn)行標(biāo)引和分類,是學(xué)科導(dǎo)航系統(tǒng)知識(shí)性的重要體現(xiàn),也是導(dǎo)航瀏覽和檢索質(zhì)量的重要保障。因此,CSDL要求學(xué)科信息門戶選擇本學(xué)科的權(quán)威、通用、與本學(xué)科主要檢索工具一致的主題詞表和分類法來(lái)對(duì)導(dǎo)航系統(tǒng)資源進(jìn)行主題標(biāo)引和分類,并根據(jù)網(wǎng)絡(luò)資源特點(diǎn)、參照流行網(wǎng)絡(luò)資源目錄和國(guó)際上主要學(xué)科信息門戶來(lái)適當(dāng)擴(kuò)展與資源類型有關(guān)的主題詞和分類類目。所選擇的詞表必須在相應(yīng)元數(shù)據(jù)元素的編碼規(guī)范屬性中予以明確,所擴(kuò)展的詞匯或類目必須以定義文件形式進(jìn)行描述并在編碼規(guī)范屬性中描述和鏈接,標(biāo)引分類過(guò)程(包括標(biāo)引分類深度)作為元數(shù)據(jù)著錄規(guī)范的一部分予以規(guī)定(可參照或直接引用現(xiàn)有的權(quán)威標(biāo)引分類規(guī)范)。
6 知識(shí)組織體系描述
所謂知識(shí)組織體系,是對(duì)內(nèi)容概念及其相互關(guān)系進(jìn)行描述和組織的機(jī)制,支持對(duì)信息對(duì)象按照知識(shí)內(nèi)容和知識(shí)結(jié)構(gòu)進(jìn)行描述、鏈接和組織。目前階段,CSDL學(xué)科信息導(dǎo)航系統(tǒng)涉及的知識(shí)組織體系主要包括主題詞表和分類表,今后嵌入語(yǔ)義門戶(Semantic Web)和智能檢索功能時(shí),還將涉及語(yǔ)義網(wǎng)絡(luò)(Semantic Networks)和概念集(Ontologies)。對(duì)于學(xué)科信息導(dǎo)航系統(tǒng)而言,知識(shí)組織體系可用于:資源標(biāo)引分類,資源主題檢索,資源分類瀏覽,與其他資源系統(tǒng)的檢索或?yàn)g覽互操作。
知識(shí)組織體系本身也是一種數(shù)據(jù),利用開(kāi)放語(yǔ)言和規(guī)范方式對(duì)它們進(jìn)行描述也產(chǎn)生元數(shù)據(jù),形成關(guān)于知識(shí)組織體系的顯性知識(shí)?赏ㄟ^(guò)對(duì)這些元數(shù)據(jù)的發(fā)現(xiàn)、交換和解析來(lái)識(shí)別、轉(zhuǎn)換、甚至重組知識(shí)組織體系,從而支持分布的學(xué)科信息導(dǎo)航系統(tǒng)間基于知識(shí)的集成以及整合檢索和整合瀏覽[23]。
知識(shí)組織體系描述可分為幾個(gè)層次:
。1)說(shuō)明性描述, 即在各層元數(shù)據(jù)中對(duì)所采用的知識(shí)組織體系進(jìn)行說(shuō)明,并通過(guò)標(biāo)準(zhǔn)URI鏈接相應(yīng)的知識(shí)組織體系定義文件, 以便用戶或用戶系統(tǒng)了解學(xué)科信息導(dǎo)航系統(tǒng)的知識(shí)組織體系。例如,在資源元數(shù)據(jù)的主題元素中通過(guò)編碼規(guī)范屬性定義所采用的詞表并鏈接定義文件,或在學(xué)科信息門戶信息架構(gòu)描述文件中描述導(dǎo)航瀏覽所采用的分類體系并鏈接定義文件。
(2)定義性描述,即直接對(duì)知識(shí)組織體系結(jié)構(gòu)、構(gòu)成元素、 元素間關(guān)系、構(gòu)造規(guī)則進(jìn)行定義和描述,所形成的描述文件作為定義文件被鏈接到有關(guān)說(shuō)明性描述中,以便利用知識(shí)組織體系進(jìn)行擴(kuò)展檢索。例如,NKOS聯(lián)盟提出VocML[24]采用標(biāo)準(zhǔn)XML DTD方式來(lái)定義和描述敘詞表和分類表及詞表映射表,支持對(duì)詞表的開(kāi)放描述、解析、顯示、交換和映射。
。3)主題圖描述,即利用一定的知識(shí)組織體系, 對(duì)導(dǎo)航系統(tǒng)資源集合的主題內(nèi)容結(jié)構(gòu)、主題詞匯、主題間相互關(guān)系以及主題與具體資源的鏈接進(jìn)行描述,形成資源集合的主題圖,可直接用于導(dǎo)航系統(tǒng)的知識(shí)化瀏覽,可建立資源集合的主題索引或交叉參照,還可鏈接復(fù)雜主題范圍的分布式資源來(lái)建立虛擬知識(shí)體系,可通過(guò)主題概念與資源的不同鏈接在同一資源體系上建立面向不同主題體系或不同用戶的資源界面。例如,XTM[25]利用XML語(yǔ)言標(biāo)記主題圖,從而用計(jì)算機(jī)可識(shí)別的開(kāi)放方式標(biāo)記資源集合的主題結(jié)構(gòu)和鏈接,支持主題瀏覽和基于詞表的智能檢索。
(4)概念集描述,即建立符合學(xué)科領(lǐng)域要求、 用開(kāi)放語(yǔ)言描述的概念集體系(Ontology Systems),利用概念集體系對(duì)信息資源內(nèi)容進(jìn)行語(yǔ)義標(biāo)注或語(yǔ)義挖掘,形成基于語(yǔ)義的資源元數(shù)據(jù)。在此基礎(chǔ)上,利用概念集中語(yǔ)義定義、語(yǔ)義關(guān)系定義和推理規(guī)則,實(shí)現(xiàn)基于語(yǔ)義的智能檢索和瀏覽[26]。
實(shí)施遞進(jìn)建設(shè)的CSDL學(xué)科信息門戶,將首先嚴(yán)格按照元數(shù)據(jù)規(guī)范對(duì)知識(shí)組織體系進(jìn)行說(shuō)明性描述,然后支持以XTM 方式逐步深入地描述分類瀏覽結(jié)構(gòu),逐步研究和嵌入詞表定義描述,并逐步研究和嵌入基于概念集的語(yǔ)義門戶功能。CSDL將通過(guò)標(biāo)準(zhǔn)和公開(kāi)的應(yīng)用規(guī)范對(duì)知識(shí)組織體系描述方式進(jìn)行規(guī)定,并逐步建立相應(yīng)的詞表、主題圖和概念集描述文件。
7 管理機(jī)制描述
學(xué)科信息門戶及其導(dǎo)航系統(tǒng)的可靠運(yùn)行和可持續(xù)發(fā)展取決于它在建設(shè)和運(yùn)行中的有效管理以及相應(yīng)管理機(jī)制的規(guī)范設(shè)計(jì)。在CSDL學(xué)科信息門戶中,與學(xué)科信息導(dǎo)航系統(tǒng)密切相關(guān)的管理機(jī)制包括資源組織機(jī)制、資源管理機(jī)制、元數(shù)據(jù)規(guī)范管理機(jī)制、用戶使用控制機(jī)制等,其中資源組織機(jī)制已在前面的資源選擇搜尋控制和資源元數(shù)據(jù)描述中予以討論。
。1)資源管理機(jī)制, 通過(guò)一系列規(guī)范對(duì)學(xué)科信息導(dǎo)航庫(kù)中資源內(nèi)容的管理方式和程序進(jìn)行規(guī)定,包括資源鏈接檢驗(yàn)規(guī)范、資源更新規(guī)范、元數(shù)據(jù)記錄維護(hù)規(guī)范、資源管理流程規(guī)范等。其中,資源鏈接檢驗(yàn)規(guī)范根據(jù)不同資源的變化規(guī)律規(guī)定對(duì)這些資源的可鏈接性進(jìn)行檢驗(yàn)的時(shí)間間隔、檢驗(yàn)方式和報(bào)告形式,資源更新規(guī)范規(guī)定對(duì)資源內(nèi)容進(jìn)行重新審查及其修改描述、修改標(biāo)引與分類、修改評(píng)價(jià)信息、刪除等處理的標(biāo)準(zhǔn)、責(zé)任分配、方式和有關(guān)技術(shù)要求,資源元數(shù)據(jù)記錄維護(hù)規(guī)范檢驗(yàn)元數(shù)據(jù)記錄的唯一性、一致性、完整性和所鏈接的其他信息的有效性,資源管理流程規(guī)范則建立資源管理工作流程序和控制機(jī)制。
。2)元數(shù)據(jù)規(guī)范管理機(jī)制, 主要指對(duì)學(xué)科信息導(dǎo)航系統(tǒng)各種元數(shù)據(jù)規(guī)范和管理規(guī)范(包括本節(jié)涉及的管理機(jī)制規(guī)范)本身的管理規(guī)定,具體說(shuō)明各種元數(shù)據(jù)規(guī)范和管理規(guī)范的描述格式和描述語(yǔ)言、內(nèi)容描述或編碼規(guī)則、公共存放位置(以支持開(kāi)放搜尋)、公
共登記要求(以支持元數(shù)據(jù)規(guī)范登記系統(tǒng)功能)、與相關(guān)資源內(nèi)容的鏈接要求、與相關(guān)定義或標(biāo)準(zhǔn)文件的鏈接要求、范例記錄編制及其存放與指向要求、版本管理制度、定期審查要求、審查責(zé)任人員、管理流程規(guī)定等,從而保證元數(shù)據(jù)規(guī)范或管理規(guī)范的有序、可靠和可持續(xù)管理。
。3)用戶使用管理機(jī)制,指對(duì)信息資源使用的控制機(jī)制, 包括合法使用范圍規(guī)范、用戶身份認(rèn)證方式、使用授權(quán)方式、使用審計(jì)程序、隱私保護(hù)政策等。需要區(qū)別狹義和廣義的資源使用控制。針對(duì)學(xué)科信息導(dǎo)航系統(tǒng),狹義控制指對(duì)導(dǎo)航系統(tǒng)內(nèi)學(xué)科信息資源的使用控制,廣義控制可能包括對(duì)導(dǎo)航系統(tǒng)中的擴(kuò)展信息、詞表數(shù)據(jù)、規(guī)范數(shù)據(jù)等的使用控制。無(wú)論是否限制用戶范圍,都應(yīng)確定使用控制規(guī)范(因?yàn)椴幌拗朴脩糁皇鞘褂每刂频囊环N特例),界定什么使用主體(Subject )在滿足什么條件(Conditions)下可對(duì)什么使用對(duì)象(Object)行使什么使用行為(Actions)。這里,使用主體可能是用戶或用戶組、 用戶代理或另一系統(tǒng),使用對(duì)象可以是具體資源、資源范圍或數(shù)據(jù)對(duì)象,使用行為包括讀、寫(xiě)、改、轉(zhuǎn)換、析取等,而條件可能是使用登記、身份認(rèn)證、閱讀版權(quán)申明、填寫(xiě)保證條款、支付費(fèi)用等。其中某些條件的驗(yàn)證與實(shí)現(xiàn)可通過(guò)鏈接第三方程序來(lái)具體實(shí)施,例如身份認(rèn)證、支付費(fèi)用等。CSDL學(xué)科信息導(dǎo)航系統(tǒng)將提供學(xué)科信息資源的公共瀏覽檢索,但為統(tǒng)計(jì)使用情況、了解用戶特點(diǎn),需要進(jìn)行(往往是隱蔽的)使用統(tǒng)計(jì);對(duì)與學(xué)科導(dǎo)航信息相鏈接的用戶討論區(qū)、用戶發(fā)表區(qū)等擴(kuò)展信息和個(gè)性化定制等擴(kuò)展功能,將限制用戶范圍、要求身份認(rèn)證;支持各種規(guī)范數(shù)據(jù)的公共查詢和閱讀,但嚴(yán)格控制對(duì)它們的刪改;另外,可能只允許其他CSDL學(xué)科信息門戶和授權(quán)用戶批量搜尋和下載導(dǎo)航資源來(lái)支持分布式導(dǎo)航信息組織和集成定制。
8 學(xué)科信息導(dǎo)航系統(tǒng)的開(kāi)放描述
所謂開(kāi)放描述,指信息系統(tǒng)通過(guò)開(kāi)放語(yǔ)言和規(guī)范方式來(lái)描述自己系統(tǒng)的數(shù)據(jù)對(duì)象、規(guī)則、管理控制機(jī)制和操作過(guò)程,支持系統(tǒng)間互操作和基于智能代理的運(yùn)行操作與管理。通過(guò)開(kāi)放描述,將形成關(guān)于本系統(tǒng)不同描述對(duì)象的描述文件,這些文件置于本系統(tǒng)公知位置或遞交公共登記系統(tǒng),第三方系統(tǒng)可以對(duì)這些描述文件進(jìn)行搜尋,按照開(kāi)放語(yǔ)言規(guī)則進(jìn)行解析,從而使第三方系統(tǒng)(或智能代理)能自動(dòng)地識(shí)別、理解本系統(tǒng)的格式和規(guī)則,并在此基礎(chǔ)上實(shí)現(xiàn)系統(tǒng)間的互操作。開(kāi)放描述并不要求采用統(tǒng)一的具體描述格式,而是規(guī)定描述時(shí)應(yīng)遵循的基本原則、底層語(yǔ)義和語(yǔ)法表示方法、標(biāo)準(zhǔn)擴(kuò)展方式、標(biāo)準(zhǔn)轉(zhuǎn)換機(jī)制等,因此不同系統(tǒng)可采用符合自己需要的不同具體方法或格式來(lái)描述實(shí)際內(nèi)容,從而在保障各個(gè)系統(tǒng)的特殊需要和本地控制的同時(shí),支持描述信息的開(kāi)放搜尋、識(shí)別和系統(tǒng)互操作。
對(duì)于CSDL學(xué)科信息門戶及其學(xué)科信息導(dǎo)航系統(tǒng)而言,開(kāi)放描述可分為描述方式和描述信息公布方式兩方面的要求,目前階段公布方式可采用在學(xué)科信息門戶Web服務(wù)器公知目錄下以公開(kāi)文件名存放描述文件,支持第三方系統(tǒng)開(kāi)放搜尋;當(dāng)CSDL元數(shù)據(jù)規(guī)范登記系統(tǒng)建立后,將描述文件提交登記系統(tǒng)進(jìn)行公共查詢。對(duì)描述方式,可有以下建議:
。1)資源元數(shù)據(jù)格式描述,采用Dublin Core作為元數(shù)據(jù)核心元素集,采用擴(kuò)展元素或擴(kuò)展屬性從其他標(biāo)準(zhǔn)元數(shù)據(jù)集中復(fù)用相關(guān)元素來(lái)描述資源的其他特征,采用Namespace方式命名所復(fù)用的元素或?qū)傩裕?nbsp; 采用XML DTD或RDF方式定義整個(gè)元數(shù)據(jù)集,采用XML 標(biāo)記和封裝輸出的資源元數(shù)據(jù)。
。2)知識(shí)組織體系描述,采用DC Subject的Encoding Scheme屬性描述資源元數(shù)據(jù)中標(biāo)引分類詞表,通過(guò)URL 鏈接相應(yīng)的定義文件或介紹文件;采用XTM描述導(dǎo)航分類體系, 其描述文件在一定的使用控制下也置于公知位置機(jī)制,供授權(quán)的第三方系統(tǒng)(例如其他CSDL學(xué)科信息門戶)進(jìn)行查詢和調(diào)用,支持資源元數(shù)據(jù)搜尋和整合;逐步支持用VocML 描述的主題詞表,相應(yīng)詞表描述文件可能作為第三方定義文件在說(shuō)明性描述中予以鏈接,支持嵌入的智能檢索功能。
。3)管理機(jī)制的描述, 涉及面向內(nèi)部的管理規(guī)范和面向第三方的管理規(guī)范,前者包括資源組織、資源管理、元數(shù)據(jù)維護(hù)等,后者主要是用戶使用控制。面向內(nèi)部的管理規(guī)范可以是文本文件或HTML/XML 文件,應(yīng)存放在系統(tǒng)公知位置,供公共查詢;但也可以用XML DTD 方式定義這些規(guī)范,一方面可支持這些規(guī)范的交換和復(fù)用,另一方面可支持對(duì)規(guī)范的自動(dòng)解析和處理(當(dāng)然需要盡量與國(guó)內(nèi)外現(xiàn)有的開(kāi)放描述格式接軌)。面向第三方的管理規(guī)范應(yīng)盡量采用開(kāi)放語(yǔ)言描述,例如用戶使用控制可采用XACL[26]來(lái)規(guī)定具體控制規(guī)范,在涉及隱私保護(hù)時(shí)參照P3P[27]制定隱私保護(hù)的政策與程序。
。4)整體學(xué)科信息導(dǎo)航系統(tǒng)的描述, 可作為學(xué)科信息門戶信息架構(gòu)(Information Architecture)定義及其描述的一部分,采用WSDL[28]開(kāi)放描述語(yǔ)言等方法,對(duì)基本信息(例如名稱、URI、學(xué)科、 簡(jiǎn)要描述等)、管理者信息(例如運(yùn)營(yíng)者、運(yùn)營(yíng)系統(tǒng)、聯(lián)系方式等)、管理機(jī)制信息(例如關(guān)于使用管理、權(quán)益保護(hù)、隱私保護(hù)、定制控制等的描述文件名稱、URI、描述規(guī)范Namespace等)、組織機(jī)制信息(例如元數(shù)據(jù)格式、知識(shí)組織體系、模塊結(jié)構(gòu)體系以及它們的URI 和描述文件地址等)進(jìn)行描述,以便第三方系統(tǒng)搜尋和解析,支持學(xué)科信息導(dǎo)航系統(tǒng)的開(kāi)放集成定制和作為第三方服務(wù)系統(tǒng)的開(kāi)放嵌入。
我們還將在學(xué)科信息門戶及其資源導(dǎo)航系統(tǒng)的建設(shè)中繼續(xù)探討上述問(wèn)題的規(guī)范建設(shè),并希望與國(guó)內(nèi)外其他單位進(jìn)行合作。
【參考文獻(xiàn)】
1 Subject Based Information Gateways. http://www.lub.lu.se/desire/sbigs.html
2 DESIRE Information Gateways Handbook.
http://www. desire.org/handbook/welcome.html
3 Nordic Interconnected Subject-Based InformationGateways. Final Report. August 2000.
http
://nwi.dtv.dk/anders/NISBIG/slutrapport.html
4 Crossroads. http://www.ukoln.ac.cn/metadata/roads/crossroads/
5 Isaac Network. http://scout.cs.wisc.edu/research/osaac/
6 Imesh Toolkit. http://www.imesh.org/toolkit/
7 European Link Treasury. http://mother.lub.lu.se/ELT/.en
8 Distributed National Electronic Resources. http://www.dner.ac.uk/
9 National Science, Math, Engineering and TechnologyEducation Digital Library.
http://www.smete.org/
10 張曉林.開(kāi)放數(shù)字信息服務(wù)體系:概念、結(jié)構(gòu)與技術(shù).中國(guó)圖書(shū)館學(xué)報(bào),2002(3)
11 ebXML. http://www.ebxml.org/
12 Web Services Activity. http://www.w3.org/2002/ws/
13 Bibliography on Evaluating Internet Resources.
http://www.lib.vt.edu/research/libinst/evalbiblio.html
14 Hofman P, Worsfold E. Selection Criteria for QualityControlled Information
Gateways. http://www.ukoln.ac.uk/metadata/DESIRE/quality/
15 ADAM Guidelines for the Selection of Resources forInclusion.
http://www.adam.ac.uk/adam/reports/select/
16 European Link Treasury Quality Assessment.
http://mother.lub.lu.se/ELT/about/quality.html.en
17 張曉林.元數(shù)據(jù)研究與應(yīng)用.北京:北京圖書(shū)館出版社,2002
18 Dublin Core Metadata Element Set Version1.1: ReferenceDescription. 1999-07-02. http://dublincore.org/documents/dces/
19 IEEE Learning Object Metadata. http://Itsc. ieee.org/doc/wg12/LOM_WD6_3.pdf
20 Olson N B. Cataloguing Internet Resources: A Manualand Practical Guide. 2nd
edition. http://www.oclc.org/oclc/man/9256cat/toc.htm
21 Day M, Cliff P. RDN Cataloguing Guidelines. http://www.rdn.ac.uk/publications/cat-guide/
22 ROADS Cataloguing Guidelines. http://www.rdn.ac.uk/publications/cat-guide/#2
23 張曉林.描述知識(shí)組織體系的元數(shù)據(jù).圖書(shū)情報(bào)工作.2002(2)
24 Vocabulary Markup Language. http://orc.dev.oclc.org5103/nkos/bin00003.bin
25 XML Topic Maps (XTM) 1.0 http://www.topicmaps.org/xtm/1.0/xtm1-20010806.html
26 XML Access Control Language.
http://www.trl.ibm.com/projects/xml/xacl/
27 Platform for Privacy Preferences. http://www.w3.org/TR/P3P/
28 Web Service Definition Language. http://www.w3.org/TR/wsdl/
【學(xué)科信息門戶中網(wǎng)絡(luò)信息導(dǎo)航系統(tǒng)的規(guī)范建設(shè)】相關(guān)文章:
稅收規(guī)范管理應(yīng)首推信息化建設(shè)08-15
信息網(wǎng)絡(luò)中的地方文獻(xiàn)08-09
研究稅收信息化建設(shè)中的信息安全技術(shù)08-18
信息室工作規(guī)范08-12
信息化與網(wǎng)絡(luò)化建設(shè)論文08-05
淺析信息技術(shù)學(xué)科中的差異性教學(xué)08-07