熟妇人妻中文字幕在线视频_无码人妻精品视频_久久躁夜夜躁狠狠躁_偷碰人妻无码视频

現(xiàn)在位置:范文先生網(wǎng)>理工論文>計算機(jī)信息技術(shù)>地方文獻(xiàn)數(shù)據(jù)庫建設(shè)初探

地方文獻(xiàn)數(shù)據(jù)庫建設(shè)初探

時間:2022-08-09 06:53:28 計算機(jī)信息技術(shù) 我要投稿
  • 相關(guān)推薦

地方文獻(xiàn)數(shù)據(jù)庫建設(shè)初探


吉安地區(qū)坐落在贛中南,是一座歷史悠久的地理文化名城,擁有豐富的地方文獻(xiàn)資源。建立吉安地方文獻(xiàn)資源數(shù)據(jù)庫,為地方經(jīng)濟(jì)建設(shè)服務(wù),是圖書館與地方經(jīng)濟(jì)建設(shè)相結(jié)合的有效途徑。

1 吉安地方文獻(xiàn)數(shù)據(jù)的采集

地方文獻(xiàn)是指有關(guān)當(dāng)?shù)氐囊磺匈Y料,表現(xiàn)為不同時期各種記載形式的文獻(xiàn),如:圖書、雜志、報紙、圖片、影片、畫片、拓本、表格、傳單、票據(jù)、文告、手稿、簿籍等。因此,地方文獻(xiàn)的數(shù)據(jù)可以從時間、空間、內(nèi)容等方面進(jìn)行采集。

1.1時間順序

吉安是一個歷史悠久的文化名城,有著 500年的歷史。我們收集地方文獻(xiàn)數(shù)據(jù)時,可以按照時間順序,從古代—近現(xiàn)代—當(dāng)代的順序進(jìn)行收集。如我館編撰的《井岡山革命斗爭史研究資料索引》,就是按照時間順序進(jìn)行的,從井岡山革命根據(jù)地的創(chuàng)立(1927.9—1928.2)井岡山革命根據(jù)地的鞏固和發(fā)展 (1928.2—1929.1)井岡山軍民堅持斗爭(1929.1—1930.2)

1.2空間范圍

地方文獻(xiàn)具有典型的地域性,使得地方文獻(xiàn)的出現(xiàn)始終與一定的地域相聯(lián)系。吉安地理位置復(fù)雜,從地形、地貌到各區(qū)方言,再到各地習(xí)俗都有很大的區(qū)別。所以,我們可以按照地理空間,一般是按行政區(qū)劃來劃分。市下設(shè)縣,縣下設(shè)鄉(xiāng)鎮(zhèn),直到村。以地名來收集地方文獻(xiàn),按地域區(qū)分隸屬關(guān)系,以地名作為細(xì)類和子目,將庫容文獻(xiàn)各歸其類,有利于編制地名歸類文獻(xiàn)檢索子系統(tǒng),形成一個樹杈式的檢索結(jié)構(gòu)。

1.3 內(nèi)容范圍

地方文獻(xiàn)是某一地域自然現(xiàn)象、社會現(xiàn)象的知識記錄。天、地、人、事、物,包羅萬象,按內(nèi)容進(jìn)行劃分可分為:

1.3.1人文、歷史類數(shù)據(jù)

(1) 吉安地區(qū)研究數(shù)據(jù) (歷史、現(xiàn)狀、人文)。對于吉安市近500 年的歷史,按時間空間順序,對期間的歷史、現(xiàn)狀、人文、風(fēng)俗進(jìn)行收集,形成該地研究數(shù)據(jù)庫。我館歷時 3年之久,編撰了《井岡山革命斗爭史研究資料索引》,匯編了全國圖書、報刊文獻(xiàn)當(dāng)中所載的有關(guān)井岡山斗爭資料1300余條,集中反映了井岡山革命斗爭史和井岡山精神。

(2) 本地區(qū)名人數(shù)據(jù)。吉安自古以來就人杰地靈,從“人生自古誰無死,留取丹心照汗青”的文天祥,到一代文豪歐陽修,再到賀子珍、袁文才、王佐等一代革命家,到曾慶紅等新一代國家領(lǐng)導(dǎo)人。以這些歷代名人組成專題數(shù)據(jù)庫,對于其中的有特殊貢獻(xiàn)的名人,可追加全文數(shù)據(jù)庫、照片數(shù)據(jù),輔之以字畫、印章等必不可少的內(nèi)容。我館目前正在建立《古代吉安名人研究資料索引》,計劃將陸續(xù)出版歐陽修、文天祥、楊萬里、劉過、劉辰翁、周大必等古代名人的研究資料索引,目前已出版 《楊萬里研究資料索引》、《歐陽修研究資料索引》。

(3)古籍?dāng)?shù)據(jù)。包括本地的全部古籍地方文獻(xiàn)的專題數(shù)據(jù)庫。由于古籍珍貴,甚至有的是孤本,不便于查詢,可通過光電掃描技術(shù),存入計算機(jī)。如《楊萬里研究資料索引》中收錄了楊萬里的詩、詞、文;《歐陽修研究資料索引》中收錄了其詩、詞、文賦以及其史學(xué)觀、經(jīng)濟(jì)觀、書法等。

(4)地方志數(shù)據(jù)。包括本地全部史志的專題數(shù)據(jù)。按照地域范圍,依次逐步采集。

(5)姓氏淵源數(shù)據(jù)。建立專題數(shù)據(jù)庫,可根據(jù)需要建立全文數(shù)據(jù)庫。

(6)譜牒多媒體數(shù)據(jù)。

(5)、(6) 兩種數(shù)據(jù)在 《楊萬里研究資料索引》和 《歐陽修研究資料索引》當(dāng)中都有所反映,資料分別介紹了歐陽修、楊萬里的家世、生平、年譜。

1.3.2 商情類數(shù)據(jù)

(1)行業(yè)動態(tài)數(shù)據(jù)。包括吉安地區(qū)熱門、重點行業(yè),如政策動態(tài)、市場、投資趨勢,形成旅游、電子、生物等行業(yè)特色專題數(shù)據(jù)。

(2) 地方企業(yè)名錄數(shù)據(jù)。吉安有許多企業(yè),如電線電纜總廠、江西電視機(jī)廠、八三四廠。建立地方企業(yè)名錄數(shù)據(jù)庫,以公司名稱、業(yè)務(wù)經(jīng)營范圍、產(chǎn)品名稱等反映公司行業(yè)主題特征的字段作為基本索引字段,以公司地址、電話、員工數(shù)字段作為輔助索引字段。

(3)地市名特產(chǎn)數(shù)據(jù)。吉安地區(qū)有許多地方名特產(chǎn),如:遂川狗牯腦茶葉、泰和武山烏骨雞、安;鹜鹊,以他們的產(chǎn)地、用途、成分等字段來描述,形成專題數(shù)據(jù)庫。

(4)旅游資料數(shù)據(jù)。吉安旅游區(qū)和待開發(fā)旅游區(qū),如:井岡山旅游區(qū)、遂川湯湖、吉安青原山道教勝地、八都毛主席故居、君山湖度假村等,按他們的地理位置、主要景點、服務(wù)項目、歷史典故等字段形成數(shù)據(jù)庫。

(5)地區(qū)農(nóng)業(yè)科技數(shù)據(jù)庫。吉安是個以農(nóng)業(yè)為主的地區(qū),開發(fā)多種經(jīng)濟(jì)作物,如:茶葉、玉米、煙葉、甘蔗等等,數(shù)據(jù)庫重點介紹地方特色產(chǎn)品的歷史、種植、栽培、加工等技術(shù)。

1.3.3 綜合數(shù)據(jù)

介紹該地各行業(yè)、各個方面的百科全書性綜合數(shù)據(jù)。

2 吉安地方文獻(xiàn)數(shù)據(jù)庫的設(shè)計

2.1書目型數(shù)據(jù)庫

書目型文獻(xiàn)數(shù)據(jù)庫即二次文獻(xiàn)數(shù)據(jù)庫,儲存原始文獻(xiàn)的題名、著者文獻(xiàn)出處、文摘、主題詞等項目。其價值在于把用戶指引到所需要的原始文獻(xiàn),如歐陽修研究,把對歐陽修研究的文章進(jìn)行二次加工,形成書目索引,可設(shè)計為書目型數(shù)據(jù)庫。在對吉安地方文獻(xiàn)進(jìn)行分類時,可把本地區(qū)名人數(shù)據(jù),人文、歷史類數(shù)據(jù),古籍、地方志數(shù)據(jù)建成書目型數(shù)據(jù)庫。目前我館建立的《古代吉安名人數(shù)據(jù)庫》,就可按照其索引資料建立書目型數(shù)據(jù)庫。

2.2 源數(shù)據(jù)庫

源數(shù)據(jù)庫即一次信息庫,儲存用戶作為檢索目的而要求獲得的數(shù)據(jù)、事實或文本。其價值在于檢索的結(jié)果可以直接滿足用戶的信息要求。按照信息形式不同可分為:

(1)數(shù)值型數(shù)據(jù)庫。如:吉安地方工農(nóng)業(yè)總產(chǎn)值、市場等。

(2)詞典型數(shù)據(jù)庫。把姓氏淵源數(shù)據(jù)、地方企業(yè)名錄、地市名特產(chǎn)品數(shù)據(jù)、旅游資源數(shù)據(jù)、農(nóng)業(yè)科技等建成詞典型數(shù)據(jù)庫。

(3) 全文本數(shù)據(jù)庫。名人著作數(shù)據(jù)庫、古籍?dāng)?shù)據(jù)庫等可建成全文本數(shù)據(jù)庫。

有些數(shù)據(jù)還可能是上述 3 種形式的結(jié)合。如:本地名人數(shù)據(jù)庫中歐陽修、楊萬里研究資料,包括了他們的原著及其研究論文、政治思想觀點、家世生平和年譜等等,內(nèi)容復(fù)雜,可建成一些復(fù)合式專題數(shù)據(jù)庫。

2.3 數(shù)據(jù)庫地址指針在數(shù)據(jù)庫文檔組織中的使用

利用倒排擋形式,把由基本索引字段構(gòu)成的基本索引款目和由輔助索引字段構(gòu)成的輔助索引款目采用倒排的形式,描述其特征標(biāo)識、存取號、字段位置。在實踐中,為了提高聯(lián)機(jī)響應(yīng)的速度,常采用兩級索引的倒排文檔結(jié)構(gòu),即將倒排文檔分為詞典文檔和存取號文檔,

詞典文檔也稱為索引文檔款目,內(nèi)容包含特征標(biāo)識、含有該標(biāo)識的記錄總數(shù)、關(guān)聯(lián)到存取號文檔的指針。詞典文檔相當(dāng)于一個索引詞表,其規(guī)模由索引詞數(shù)量決定,基本不受數(shù)據(jù)庫文獻(xiàn)或數(shù)據(jù)記錄增加的影響,可以極大提高系統(tǒng)對檢索終端的響應(yīng)速度。存取號文檔的款目主要包括與詞典文檔指針關(guān)聯(lián)的存儲地址、含有該標(biāo)識的記錄存取號,以及該標(biāo)識在記錄中所處的字段及其位置。這樣的兩級索引結(jié)構(gòu)不僅包括了原倒排的全部內(nèi)容,而且使主機(jī)聯(lián)機(jī)響應(yīng)速度得到極大的提高。這是由于特征標(biāo)識與含有該標(biāo)識的存取號及其字段位置的分離。雖然使文檔的結(jié)構(gòu)更為復(fù)雜,卻突破了原先倒排文檔的索引款目會因記錄的增加而數(shù)百倍增加,進(jìn)而因文檔的規(guī)模擴(kuò)大而影響檢索速度的限制。在 《歐陽修研究資料索引數(shù)據(jù)庫》當(dāng)中,由于數(shù)據(jù)庫規(guī)模大,所以也可使用指針來達(dá)到提高聯(lián)機(jī)響應(yīng)的速度。如使用輔助索引倒排的兩級結(jié)構(gòu)。

另外,使用鏈接link把書目型數(shù)據(jù)庫和文摘型數(shù)據(jù)庫、全文數(shù)據(jù)庫都可以連接起來,實現(xiàn)根據(jù)檢索需求,查找地方文獻(xiàn)的題錄、文摘或全文的目的。

〔出處〕 科技情報開發(fā)與經(jīng)濟(jì)2003(9)



【地方文獻(xiàn)數(shù)據(jù)庫建設(shè)初探】相關(guān)文章:

職業(yè)學(xué)校班級學(xué)風(fēng)建設(shè)初探08-16

淺談地方道路建設(shè)與發(fā)展08-12

新時期加強(qiáng)領(lǐng)導(dǎo)干部作風(fēng)建設(shè)初探08-12

評語初探08-17

中學(xué)生網(wǎng)絡(luò)道德素質(zhì)測評體系建設(shè)初探08-16

網(wǎng)上德育初探08-17

“愉快教學(xué)”初探08-19

河南省基礎(chǔ)教育資源共建共享區(qū)域聯(lián)盟建設(shè)初探08-20

現(xiàn)階段鄉(xiāng)鎮(zhèn)地方稅源建設(shè)研究與思考08-16

現(xiàn)階段鄉(xiāng)鎮(zhèn)地方稅源建設(shè)研究與思考08-15