熟妇人妻中文字幕在线视频_无码人妻精品视频_久久躁夜夜躁狠狠躁_偷碰人妻无码视频

現(xiàn)在位置:范文先生網(wǎng)>教學(xué)論文>綜合教育論文>制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考

制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考

時間:2023-02-20 10:17:38 綜合教育論文 我要投稿
  • 相關(guān)推薦

關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考

  【內(nèi)容提要】作者認(rèn)為,中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)以DC為基本框架,并完全遵循和保留DC的結(jié)構(gòu)、特點及擴展方式等,堅決防止CNMARC化傾向;中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)形成一個完整的體系,對所涉及的相關(guān)的中文標(biāo)準(zhǔn)、規(guī)則、方案等,按照通用性、易用性等原則進行修改和制定;這一標(biāo)準(zhǔn)體系應(yīng)成為全球各類中文信息資源著錄和檢索的標(biāo)準(zhǔn)。
【摘  要  題】信息資源建設(shè)與管理
  元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”,現(xiàn)在常說的元數(shù)據(jù),是特指在標(biāo)記語言(SGML、HTML、XML)環(huán)境下,對網(wǎng)絡(luò)信息資源進行描述的解決方案,主要是用于網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、存儲、管理和檢索利用。在當(dāng)前網(wǎng)絡(luò)信息呈異常迅猛發(fā)展之勢,大量的多樣性的數(shù)字化資源,使得信息的利用和查找十分困難。為了解決這一問題,在國外已有了很多的元數(shù)據(jù)研究項目和成果,建立和運行了一些描述網(wǎng)絡(luò)信息資源的元數(shù)據(jù)模式。元數(shù)據(jù)的應(yīng)用,為網(wǎng)絡(luò)信息資源的有序組織、適度控制和高效檢索利用,提供了便利的條件。近年來,中文網(wǎng)絡(luò)信息資源也在迅速增長,盡快研究和制定中文核心元數(shù)據(jù)標(biāo)準(zhǔn),已是非常迫切的了。在制定中文元數(shù)據(jù)標(biāo)準(zhǔn)時,既要考慮到中文元數(shù)據(jù)處理的特殊性和中文資源的應(yīng)用特點,更要從全球的信息大環(huán)境出發(fā),分析、研究和借鑒國際上先進的、通用的元數(shù)據(jù)標(biāo)準(zhǔn),在盡量保持與國際標(biāo)準(zhǔn)接軌的基礎(chǔ)上,制定符合中文資源應(yīng)用需要的擴展與應(yīng)用規(guī)范。
    1 中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)以DC為基本框架
  在國際上眾多的元數(shù)據(jù)方案中,Dublin  Core  Element  Set(都柏林核心元素集,簡稱DC),以其結(jié)構(gòu)簡單、語意互通和可擴展等特性,事實上已成為國際范圍內(nèi)通用的網(wǎng)絡(luò)信息資源描述的元數(shù)據(jù)標(biāo)準(zhǔn)。DC經(jīng)過幾次國際會議的研討和修訂,已逐步完善和成熟。所以,制定中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)以DC元數(shù)據(jù)為基本框架。國內(nèi)在四五年前就已開始了對DC的探討和研究,但至今尚未完全形成依托中文環(huán)境的DC元數(shù)據(jù)標(biāo)準(zhǔn)。當(dāng)前應(yīng)進一步加緊深入地對其進行研究和規(guī)范,形成中文元數(shù)據(jù)的一個標(biāo)準(zhǔn)核心集,以適應(yīng)中文網(wǎng)絡(luò)信息資源的發(fā)展。中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)完全按照DC元數(shù)據(jù)集來建立,在具體作法上要注意以下一些問題。
  (1)完全按照DC元數(shù)據(jù)的框架結(jié)構(gòu)來制定中文元數(shù)據(jù)標(biāo)準(zhǔn)。由于網(wǎng)絡(luò)信息資源在時空上的廣泛性和開放性,與傳統(tǒng)的文獻著錄的相對封閉性有著很大的不同,因此,中文元數(shù)據(jù)標(biāo)準(zhǔn)的制定,應(yīng)強調(diào)與國際接軌,保持完整的一致性。也就是說要完全遵循DC元數(shù)據(jù)的框架結(jié)構(gòu)來構(gòu)建中文元數(shù)據(jù)標(biāo)準(zhǔn),而不應(yīng)該提出“以DC為主,參考其它元數(shù)據(jù)標(biāo)準(zhǔn)”來搞中文元數(shù)據(jù)標(biāo)準(zhǔn)。我們應(yīng)汲取CNMARC的教訓(xùn),避免把中文元數(shù)據(jù)標(biāo)準(zhǔn)搞成“CNDC”。中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)該只是對DC元數(shù)據(jù)進行本地化和中文化的處理,對它的內(nèi)涵、外延等用中文予以標(biāo)準(zhǔn)地詮釋,方便使用中文的著錄者和檢索者理解與利用,僅對于著錄和檢索中文信息資源的一些特殊性和應(yīng)用特點等有限的方面進行規(guī)范的規(guī)定和定義。
  (2)中文元數(shù)據(jù)標(biāo)準(zhǔn)的制定,應(yīng)完全保留DC元數(shù)據(jù)的基本特點。一般地講,內(nèi)在性、可擴展性、獨立句法結(jié)構(gòu)、可選擇性、可重復(fù)性和可修飾性是DC的6大特點,在實踐中集中地表現(xiàn)為DC元數(shù)據(jù)的簡易性、通用性、兼容性以及靈活的可擴展性,這些特性是DC能夠成為一個國際上通行的元數(shù)據(jù)標(biāo)準(zhǔn)的原因,也是建議中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)完全按DC來制定的理由。因此,在制定中文元數(shù)據(jù)標(biāo)準(zhǔn)時,要完全保留DC的基本特點,不應(yīng)有任何的更改。在國內(nèi)有些使用DC元數(shù)據(jù)時,將某些元素規(guī)定為“不可重復(fù)”或“必備”等等,這種做法是不可取的。
  (3)應(yīng)以國際通行的DC修飾限定詞作為中文元數(shù)據(jù)的規(guī)范和擴展的依據(jù),而不應(yīng)采用其它形式。DC修飾詞提供了對元數(shù)據(jù)的擴展描述,可以縮小元素的含義范圍,使其更具有專指性,或是對元素進行規(guī)范性說明。目前,DC已正式確定了三類修飾:模式體系、語言種類和類型。如為了表達不同的日期,在使用“Data(日期)”這一元素時,可以增添“Created(創(chuàng)建)”、“Valid(有效)”、“Issued(發(fā)行)”、“Modified(修改)”等修飾詞。在中文元數(shù)據(jù)標(biāo)準(zhǔn)中,不應(yīng)把這些元素的修飾詞解釋為子元素。元素與加了修飾詞的元素沒有主次之分,修飾詞并不改變元素本身的定義。元數(shù)據(jù)標(biāo)準(zhǔn)中,不應(yīng)出現(xiàn)子元素的提法。元素的修飾限定和規(guī)范,是元數(shù)據(jù)元素的內(nèi)在特性,是元素的不同表現(xiàn)形式,絕不能把元素和加了修飾詞的元素看作是元素與子元素的關(guān)系,應(yīng)堅決防止中文元數(shù)據(jù)標(biāo)準(zhǔn)的MARC化傾向(在MARC中就有的字段、子字段之分)。元素與加了修飾詞的元素或多個附加了修飾詞的元素同時出現(xiàn),是元數(shù)據(jù)的元素可重復(fù)性的體現(xiàn)。
    2 中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)形成一個完整的體系
  中文元數(shù)據(jù)標(biāo)準(zhǔn)是整個網(wǎng)絡(luò)上中文信息資源及中文電子出版物等的著錄和檢索的工具,其應(yīng)用范圍是很廣泛的。因此,制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的同時,還應(yīng)對所涉及的相關(guān)的標(biāo)準(zhǔn)、規(guī)則和條例等進行研究、修改和制定,并逐步完善其推廣應(yīng)用機制,使中文元數(shù)據(jù)標(biāo)準(zhǔn)逐步形成一個完整的體系,更好地服務(wù)于日益發(fā)展的中文網(wǎng)絡(luò)信息資源的開發(fā)和應(yīng)用。與中文元數(shù)據(jù)標(biāo)準(zhǔn)相配套使用的一系列標(biāo)準(zhǔn)、規(guī)則和條例等的制定、修訂,要本著易用性、通用性、國際性和規(guī)范化、標(biāo)準(zhǔn)化、自動化的原則進行。這方面的工作主要的有以下一些:
  (1)修訂和完善各類中文信息的代碼體系,并盡量與國際通用的代碼一致起來。制定有關(guān)中文的“資源類型表”、“格式類型表”、“關(guān)聯(lián)值列表”等,以規(guī)范中文信息資源的著錄和檢索利用。
  (2)制定有關(guān)中文關(guān)鍵詞選詞截詞等規(guī)則,以適應(yīng)中文信息資源的自動化著錄和檢索。制定中文網(wǎng)頁及電子出版物、數(shù)據(jù)庫等的制作規(guī)范和條例。
  (3)編制一個簡單易用,能夠適應(yīng)數(shù)字化信息著錄和檢索的“中文信息資源樹形分類表”。目前圖書館界廣泛應(yīng)用的《中圖法》,其分類體系和類目設(shè)置均無法適應(yīng)網(wǎng)絡(luò)時代信息分類的要求。
  (4)建立一個像OCLC的CORC項目那樣的中文元數(shù)據(jù)在線編目系統(tǒng),免費提供中文網(wǎng)頁或電子出版物的元數(shù)據(jù)自動生成。還應(yīng)建立CNMARC與中文元數(shù)據(jù)的映射表,提供CNMARC數(shù)據(jù)向中文元數(shù)據(jù)格式的轉(zhuǎn)換等服務(wù)。
  (5)仿照印刷文獻的在版編目(CIP)規(guī)定,制定中文網(wǎng)頁和電子出版物的在版元數(shù)據(jù)著錄規(guī)定,以行政手段強制要求所有正式注冊的中文網(wǎng)頁及電子出版物等,必須具備元數(shù)據(jù)著錄項目,實現(xiàn)中文網(wǎng)絡(luò)信息資源的作者著錄,使中文元數(shù)據(jù)能夠較快地在大范圍內(nèi)推廣,方便中文資源的高效利用。
    3 中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)是全球各類中文信息資源著錄和檢索的標(biāo)準(zhǔn)
  網(wǎng)絡(luò)信息資源發(fā)展迅速、包羅萬象,且具有廣泛性、開放性和分布式的特征,任何一種元數(shù)據(jù)都難以滿足所有的需要。因此,元數(shù)據(jù)的標(biāo)準(zhǔn)框架應(yīng)是一種可擴展的核心集,以應(yīng)付各種需要。DC就是這樣一種元數(shù)據(jù)集,以DC為基本框架構(gòu)建的中文元數(shù)據(jù)標(biāo)準(zhǔn)也應(yīng)是一種可擴展的核心元數(shù)據(jù)集。中文元數(shù)據(jù)標(biāo)準(zhǔn)除了要完整地保持國

際通用的擴展外,還應(yīng)制定一些適應(yīng)中文資源應(yīng)用所需的擴展,并對這類特殊的擴展進行規(guī)范和控制。所有的元素或擴展的元素修飾限定詞的著錄標(biāo)識,仍以DC規(guī)定的規(guī)范的英文名稱來標(biāo)識,不應(yīng)用中文來標(biāo)識。
  中文核心元數(shù)據(jù)是各類中文數(shù)字化信息的描述、管理、保存和利用的標(biāo)準(zhǔn),它必須是能夠應(yīng)用于各種領(lǐng)域的數(shù)字化資源,如數(shù)字圖書館、電子政府、網(wǎng)絡(luò)商務(wù)、各類數(shù)據(jù)庫、電子出版物等等方面,也應(yīng)是用于整個Internet網(wǎng)絡(luò)中文信息的統(tǒng)一標(biāo)準(zhǔn),能夠?qū)崿F(xiàn)異構(gòu)資源間的互操作,在更廣的范圍內(nèi)實現(xiàn)中文信息資源的共建共享。因此,中文元數(shù)據(jù)標(biāo)準(zhǔn)的研究制定,絕不能僅僅局限在圖書館界人員,而應(yīng)在更大的范圍內(nèi),采取開放式的研討方式。我們都知道,DC元數(shù)據(jù)是由圖書館、計算機、網(wǎng)絡(luò)等方面的專家和學(xué)者共同研討的產(chǎn)物,我們也應(yīng)借鑒這一經(jīng)驗,而且參與者的學(xué)科范圍和專業(yè)領(lǐng)域要更擴大一些,這樣制定出的中文元數(shù)據(jù)標(biāo)準(zhǔn),才能廣泛地應(yīng)用于各學(xué)科領(lǐng)域,成為中文信息資源描述的基礎(chǔ)的跨領(lǐng)域的元數(shù)據(jù)集。
  中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)是全球所有中文資源著錄和檢索的標(biāo)準(zhǔn),應(yīng)得到海內(nèi)外從事中文信息資源建設(shè)的專家學(xué)者的廣泛支持和參與,采取聯(lián)合、協(xié)作、共建共享的方式,加強合作,避免重復(fù)開發(fā)。使制定出的中文元數(shù)據(jù)標(biāo)準(zhǔn)具有更為廣泛的適用性和權(quán)威性,并形成一個國際通用的中文元數(shù)據(jù)標(biāo)準(zhǔn)體系,推動全世界的中文數(shù)字化信息資源的建設(shè)和發(fā)展。
  收稿日期:2003-06-09
【參考文獻】
  1 王新.都柏林核心集綜述.情報理論與實踐,2000,(5)
  2 趙慧勤.網(wǎng)絡(luò)信息資源組織——Dublin  Core元數(shù)據(jù).情報科學(xué),2001,(4)
  3 任瑞娟,吳軍霞.DC與圖書館Web信息發(fā)布.現(xiàn)代圖書情報技術(shù),2001,(5)
  4 吳開華,邢春曉,羅德胤.數(shù)字圖書館元數(shù)據(jù)研究.中國圖書館學(xué)報,2002,(3)
  5 劉源,吳利薇.元數(shù)據(jù)及其格式研究.圖書館論壇,2002,(3)
  6 王松林.元數(shù)據(jù)及有關(guān)思考.情報學(xué)報,2002,(4)
  7 梅海燕.元數(shù)據(jù)的研究進展.現(xiàn)代圖書情報技術(shù),2002,(4)
  8 高建勛,吳開華.元數(shù)據(jù)發(fā)展中的熱點問題討論.圖書館,2002,(5)
  9 黃星亮.都柏林核心元數(shù)據(jù)及其在我國數(shù)字圖書館建設(shè)中的應(yīng)用.圖書館學(xué)研究,2002,(7)
  10 賀宜.中文元數(shù)據(jù)開發(fā)與應(yīng)用的分析和思考.情報雜志,2002,(9)
  11 郝亞玲.DC元數(shù)據(jù)與網(wǎng)絡(luò)信息資源的描述.情報科學(xué),2002,(10)
  12 中文元數(shù)據(jù)應(yīng)用國際研討會會議文集.http://www.libnet.sh.cn/dcchina.


【制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考】相關(guān)文章:

地方數(shù)據(jù)庫建設(shè)實踐與思考08-09

關(guān)于地方文獻數(shù)據(jù)庫建設(shè)的思考08-09

構(gòu)建地方文獻數(shù)據(jù)庫的思考08-09

關(guān)于“一元錢”官司的思考08-12

關(guān)于制定《環(huán)境損害賠償法》的思考08-06

組建萍鄉(xiāng)地區(qū)地方文獻數(shù)據(jù)庫的思考08-09

建設(shè)河池地區(qū)地方文獻數(shù)據(jù)庫的思考08-09

讀《數(shù)學(xué)新課程標(biāo)準(zhǔn)》的思考08-08

發(fā)展三元雜交豬的實踐與思考08-12