- 相關推薦
論地方文獻報刊信息數(shù)據(jù)庫及主題標引工作
1 地方文獻報刊信息數(shù)據(jù)庫
地方文獻是指內(nèi)容上具有地域性,同時具有重復使用價值的文獻。由于它完整、系統(tǒng)地記錄了特定地域內(nèi)自然和人文方面的各種信息,從而為人們提供了研究特定地域內(nèi)歷史、現(xiàn)代及未來的有關資料。
地方文獻的類型多種多樣,報刊文獻是其中的一種。它具有信息量大,傳遞周期短,內(nèi)容相對客觀、翔實等特點。但由于它的總量太大,有關的地方文獻信息分散在不同時期、不同品種的報刊之中。僅靠瀏覽原始文獻,迅速查到有關資料,幾乎是不可能的。地方文獻報刊索引就是為解決這一問題而編制成的一種檢索工具。
在手工時代,地方文獻報刊索引表現(xiàn)為篇目索引或題錄索引的形式,即將報刊中所載地方文獻篇目按一定順序編排起來,以利讀者查找文章的所在位置。這種索引不反映文章的具體內(nèi)容,只具有指向和示址作用。同時,也對地方事物起著揭示和報道的作用。除了作為一種綜合性的檢索工具外,還可以在這種索引的基礎上編制各種情報報導刊物,或圍繞特定學科及專業(yè)進行定向報導和檢索,以服務于地方的各項事業(yè)。
鑒于地方文獻報刊索引的重要作用,許多公共圖書館都曾積極編制這種索引。例如,首都圖書館自50年代起開始編制《北京地方文獻報刊資料索引》,涵蓋了本世紀以來的內(nèi)容;甘肅省圖書館也是在同一時期開始編制西北五省的地方文獻報刊索引;長春市圖書館也曾編制了《東北地方文獻索引》等檢索工具。為了避免目錄體系過于龐大,這種卡片式篇目索引一般僅以分類方式編排。因此讀者也只能從分類途徑對報刊上的地方文獻信息進行檢索。 進入計算機時代以來,以數(shù)據(jù)庫形式來處理地方文獻信息已成為圖書館地方文獻工作的必然趨勢。計算機所具有的自動識別與排序功能,使地方文獻信息的編排檢索變得更加方便、更加快捷。通過全文掃描技術完成的報刊全文數(shù)據(jù)庫,使得報刊上的地方文獻信息得到更充分地揭示和利用。由于計算機具有一次性輸入,多途徑輸出的功能,因而在對地方文獻信息進行存儲與檢索時,增加了篇名、著者、出版、文摘等多方面的途徑。尤其是從主題途徑檢索地方文獻信息的問題得到了很好地解決。
在地方文獻報刊信息數(shù)據(jù)庫(以下簡稱報刊信息庫)中,分類標引和主題標引都是以揭示文獻內(nèi)在特征為目的的標引方法,只是揭示的角度有所不同。由于地方文獻的史料特征極為明顯,故地方文獻的讀者往往是從特定的事件、人物、時間、地域的角度入手進行檢索。因而可以說主題檢索是一種最直接反映地方文獻內(nèi)容特征的檢索途徑,也是建立檢索工具和檢索系統(tǒng)的基礎和前提。近些年來,圖書情報界對有關主題標引的原則和操作方法有過許多研究和探討,撰寫過很多的著作和文章。但由于地方文獻中連續(xù)出版物本身所具有的特征,其主題標引的原則和方法與其它類型文獻的標引還是有所不同。本文擬從報刊信息數(shù)據(jù)庫的建設入手,探討有關地方文獻報刊信息主題標引的一些問題。
2 地方文獻報刊信息數(shù)據(jù)庫中的主題標引
2.1詞表的編制
報刊信息庫與其它類型數(shù)據(jù)庫相比,最突出的特點是要反映地方文獻本身所具有的特征。同時還要滿足地方文獻用戶特殊的檢索需求。因此,選擇一部適合地方文獻特征的主題詞表是開展標引工作的首要問題。
《漢語主題詞表》(以下簡稱漢表)是一部供機檢使用的綜合性基礎型詞表。它所收錄的詞匯可以供各個機構和行業(yè)從中選詞,以編制適合本專業(yè)或本機構使用的專業(yè)詞表。實際上,我國很多專業(yè)情報機構和圖書館都是在參考這部國家詞表的基礎上編制自己詞表的。在編表過程中,抽取主題詞時當盡可能不破壞原有詞表的詞間關系。但必要時,詞間關系及基本范疇還是需要重新確定的。
由于地方文獻是對某一地域自然和人文現(xiàn)象的客觀描述,它所表現(xiàn)出的地域性和專指性極強。用綜合性的《漢表》來標引各地的地方文獻,則將有相當部分的文獻不能被準確地表達其主題概念;其次,地方文獻的內(nèi)容范疇與《漢表》中的基本范疇也有所不同!稘h表》是以學科體系作為劃分范疇的基本依據(jù);而地方文獻則是以特定地方的自然環(huán)境、人文環(huán)境和地方事業(yè)作為劃分范疇的基本依據(jù)。所以地方文獻主題詞表需要在《漢語主題詞表》的基礎上自行編制。
地方文獻主題詞表中所收錄的主題詞來源主要有:
①《漢表》中已有的詞匯。這是地方文獻與非地方文獻都使用的綜合性詞匯,它占將來的地方文獻主題詞表所收詞匯的絕大部分。由于是從《漢表》中選詞,所以它們是相對規(guī)范的。
②《漢表》中沒有的,帶有地方特點的詞匯,如:北京地方文獻的“琉璃廠”、天津地方文獻中的“皇會”、廣東地方文獻中的“早茶”等,這部分詞匯雖然在未來的地方文獻主題詞表中所占比例不會很大,但它們卻是出現(xiàn)頻率相對較高的詞匯。對于這部分詞匯及其詞間關系,地方文獻工作者需要加以規(guī)范。
③《漢表》作為階段性產(chǎn)品,它的編制受時間的限制,對于編表以后新產(chǎn)生的一些詞匯它不可能收錄,在新編的地方文獻主題詞表中收錄這部分詞,也需要加以規(guī)范。
由于編制先組式的主題詞表需要一段相當長的時間,同時還要編制一系列的標引細則,這將會影響報刊信息庫主題標引工作的迅速展開。因此,可以采用另一種方式,即首先確定一段時間為試驗期,先進行地方文獻的標引工作。由標引人員直接從報刊所載的地方文獻信息內(nèi)容中選取有檢索意義的關鍵詞作為主題詞。這種主題詞是未經(jīng)規(guī)范的自然語言,也無詞間關系可言,待積累了一定數(shù)量之后,再對其進行修改、充實,并參照《漢表》使之規(guī)范化。確定好詞間關系和基本范疇,從而形成適用的詞表。這種詞表是后控式的,采用這種方式選詞更直觀,專指性強,還能使標引工作與修改詞表同時進行。而且標引時不用考慮詞間關系及查表抽詞,所以標引速度快。在標引時采用自然語言,對標引人員的要求也相對較低。目前,廣東省中山圖書館的地方文獻數(shù)據(jù)庫系統(tǒng)主題標引就采用了這種方法。
2.2主題詞字段的設置
無論是先有詞表,還是先進行標引工作,在報刊信息庫中,都需要設置若干個主題詞字段,以便展開具體的標引工作。在設置主題詞字段時,一定要注意反映地方文獻的時空特征;在空間方面完整、系統(tǒng)地記錄特定地域內(nèi)自然和人文方面的各種信息;在時間上又形成了一個連續(xù)的信息集合。這是一切地方文獻工作最基本的原則。
在報刊信息庫中,首先應設置涉及文獻基本內(nèi)容的“內(nèi)容主題詞”字段。此字段選詞靈活性大,標引的內(nèi)容也十分廣泛。它對所有地方文獻信息的內(nèi)容范疇進行涵蓋,也是以后編制地方文獻主題詞表時確定詞表基本范疇的依據(jù)。從地方文獻的性質和特征來看,它是對特定地區(qū)自然、社會、人文諸般事物的歷史與現(xiàn)狀進行全面系統(tǒng)地綜合性記錄,涉及的內(nèi)容極為廣泛。如反映一個地區(qū)所能觀察到的天文現(xiàn)象、地質水文結構、地形地貌、氣候與氣象、物種與資源以及反映該地區(qū)的人文地理、歷史、地方人物、社會經(jīng)濟、地方政治、社會結構、地方文化、教育等各個方面。
報刊信息庫中“內(nèi)容主題詞”字段的主題詞性質絕大部分是綜合性的,與其它非地方文獻數(shù)據(jù)庫中的主題詞無太大區(qū)別。例如“社會治安”,“計量管理”、“住宅區(qū)”、“軟件產(chǎn)業(yè)”等;也有一部分是地方文獻內(nèi)容所特有的地方性詞匯,如“敦煌石窟”、“庚子事變”、“廠甸”等;另外,新產(chǎn)生的一些地方文獻信息的內(nèi)容,也應通過內(nèi)容主題詞來表達?傊,凡是涉及到地方文獻的所有內(nèi)容特征,都應在此字段予以反映。
這一字段并非地方文獻數(shù)據(jù)庫所特有,有關具體標引方法的討論從略。
另一種主題字段的設置應反映地方文獻內(nèi)容特征以外的其它特征。地方文獻最大的特點,就在于文獻所記載的現(xiàn)象、事實和人物都被限定在某一特指的時空范圍內(nèi)。也就是說。地方文獻所涉及的內(nèi)容范疇均會通過特定的時間、地點、團體機構、人物等因素反映和輸出。地方文獻用戶的檢索習慣也往往是從某一地域范疇、地區(qū)名稱、某一事件、某一人物入手。因此,有必要在地方題錄庫中設置“地域主題詞”、“時間主題詞”、“團體主題詞”和“個人主題詞”諸字段。它們是揭示地方文獻的本質特征所必須的字段。同時也是地方文獻數(shù)據(jù)庫系統(tǒng)中所特有的。
以上四個主題詞字段所反映的是有關地方文獻信息中客觀存在的某些因素,如“地域主題詞”中的“東城區(qū)”、“梅山縣”、“個人主題詞”中的“梅蘭芳”、“秋瑾”等。盡管這四種主題詞的標引與“內(nèi)容主題詞”的標引相比,相對容易些,但仍需積累到一定數(shù)量后進行規(guī)范。例如“團體主題詞”中的機構名稱是用全稱還是用簡稱,以及“個人主題詞”中的人物名稱是用本名還是用筆名,這些都需要地方文獻工作者在以后的工作中根據(jù)本地區(qū)的具體情況加以規(guī)范。
具體的標引方法是:
地域主題所標引的不是整體地方文獻的地域,而是文章內(nèi)容涉及的某一具體區(qū)域的名稱,或者給文章內(nèi)容帶來影響的區(qū)域名稱。如有關北京地方文獻的內(nèi)容不用標“北京”,直接標引具體的“東城區(qū)”、“昌平縣”等行政區(qū)劃名稱;內(nèi)容涉及到較具體的地名時也可標引地名,例如“王府井大街”、“方家胡同”等;如果文章中所反映的地區(qū)更詳細,區(qū)(縣)、街道(鄉(xiāng)鎮(zhèn))、村等具體名稱都有,可逐級進行標引,中間用分隔符隔開,如北京地方文獻中的“順義縣%趙全營鎮(zhèn)%北郎中村”;在標引中,遇到舊有的行政區(qū)劃名稱或舊地名時,為反映某一地區(qū)名稱的歷史發(fā)展沿革,應將現(xiàn)行行政區(qū)劃名稱與舊有行政區(qū)劃名稱同時標引作為檢索點,現(xiàn)有行政區(qū)劃名稱或新地名標在前面, 舊行政區(qū)劃名稱或舊地名注于其后,可用括號括起。如“東城區(qū)(內(nèi)三區(qū))”。以上的標引方法主要是針對地方文獻用戶特定的檢索需求而言。
年代主題標引的是文獻內(nèi)容所涉及的時間范圍,而不是文獻撰寫或出版發(fā)行的時間。清以前的歷朝歷代均可使用“朝代%年號”的方法標引.如“清代%乾隆”,中華民國時期(1919年前)可標引成“民國時期”,到了1920年以后可以標引成“二十年代”、“六十年代”等。
團體主題和個人主題標引的是文章內(nèi)容所涉及到某一具體機構、個人,或與某地方有關系的機構和個人。團體主題標引時,用機構和單位的標準全稱,如“北京市中級人民法院”、“重慶市技術監(jiān)督局”等;而個人主題的標引,是標具體人名,例如“梅蘭芳”;如果遇到同一人物有本名與筆名時,要同時標引,如“魯迅”與“周樹人”、“老舍”與“舒舍予”之間可用符號“%”隔開;遇到清代人物或少數(shù)民族人物的名稱較長時,一般應標引人物的全名,如“愛新覺羅·溥儀”。
總之,無論標引什么類型的主題詞,標引人員都要站在用戶的角度,即從索引的終極使用目的出發(fā),給地方文獻實際使用者提供有價值的地方文獻信息。因此,在對報刊信息庫進行主題標引過程中一定要確定好標引深度。地方文獻報刊索引的標引深度,則取決于地方文獻各類用戶的檢索需求。地方文獻的研究級用戶的檢索需求包括:決策、管理人員宏觀的檢索需求、科研人員較專深的檢索需求及設計生產(chǎn)人員的針對性檢索需求等。
盡管采用數(shù)據(jù)庫系統(tǒng)處理地方文獻信息這一手段在全國各類圖書館的地方文獻業(yè)務中開展得還不夠普遍,但這是地方文獻工作發(fā)展的必然趨勢。結合地方文獻本身的特點來制訂適用的主題詞表、分類表,是實現(xiàn)地方文獻信息處理標準化的必要步驟。它可為今后進行聯(lián)機檢索,進入國家和地區(qū)網(wǎng)絡,從而實現(xiàn)地方文獻資源共享打下堅實的基礎。同時,計算機多途徑檢索所產(chǎn)生的效果也會使地方文獻信息資源得以更充分地研究與利用。
參考文獻
1 韓樸.圖書館地方文獻工作.北京:文津出版社,1992
2 中國科學技術情報研究所.北京圖書館.漢語主題詞表.北京:科學技術文獻出版社,1979
3 莫少強.建立地方文獻數(shù)據(jù)庫促進地區(qū)出版物資源共享.圖書館學通訊,1986,(3)
〔出處〕 圖書館學刊 1999(2)
【論地方文獻報刊信息數(shù)據(jù)庫及主題標引工作】相關文章:
西北地方文獻報刊索引數(shù)據(jù)庫及主題標引08-09
地方文獻信息論08-09
《北京地方文獻報刊信息管理系統(tǒng)》主題標識論析08-09
論地方文獻08-09
文獻 地方文獻 地方文獻學論考08-09
論地方文獻書目08-09
論地方文獻與地方經(jīng)濟08-09
關于機讀目錄中地方文獻主題標引的探討08-09
論地方文獻與樣本安全08-09