- 相關(guān)推薦
中國(guó)地方志(舊方志)資源庫(kù)的設(shè)計(jì)與展望
一. 中國(guó)地方志(舊方志)資源庫(kù)建庫(kù)緣起
地方志,也稱為“方志”,“志”就是“記”,是記錄、記載、記述的意思。顧名思義,“地方志”就是一個(gè)地方從古到今,從自然到社會(huì)方方面面情況的總覽。中國(guó)國(guó)家圖書(shū)館特色館藏,就包括1949年以前編纂的地方志(簡(jiǎn)稱舊方志),不論質(zhì)量還是數(shù)量均居海內(nèi)外各藏書(shū)單位之首。對(duì)于先人留給我們的這一寶貴文化遺產(chǎn),我們有責(zé)任保護(hù)、利用和推介。采用數(shù)字化的形式,整理、加工舊方志資源,是實(shí)現(xiàn)這一目標(biāo)的有效途徑。
方志資源庫(kù)采用什么樣的結(jié)構(gòu)模式,是建庫(kù)之初首先遇到的問(wèn)題。國(guó)家圖書(shū)館資源庫(kù)的發(fā)展歷程伴隨著圖書(shū)館發(fā)展的腳步,也經(jīng)歷了從傳統(tǒng)館藏資源———館藏資源數(shù)字化———數(shù)字圖書(shū)館資源庫(kù)發(fā)展三部曲。我館現(xiàn)在已有的數(shù)據(jù)庫(kù),大多是將傳統(tǒng)館藏經(jīng)過(guò)數(shù)字化處理生成的。方志資源庫(kù)如采用原有的思路,即把志書(shū)平行地轉(zhuǎn)換成數(shù)字化內(nèi)容,那我們最終實(shí)現(xiàn)的僅是把紙質(zhì)志書(shū)轉(zhuǎn)換成電子志書(shū)。就載體形態(tài)來(lái)說(shuō),志書(shū)數(shù)字化使其發(fā)生了質(zhì)的飛躍,但就內(nèi)容而言,它僅是形式的變化。而當(dāng)今信息網(wǎng)絡(luò)技術(shù)的發(fā)展,信息網(wǎng)絡(luò)資源的迅速擴(kuò)大,越來(lái)越影響和改變著人們選擇信息、使用信息的行為和方式。人們對(duì)知識(shí)的需求已不滿足于以文獻(xiàn)為單位,而是希望通過(guò)簡(jiǎn)單、快捷的方式檢索到所需文獻(xiàn)中的具體事件、數(shù)據(jù)、結(jié)論等知識(shí)單元,同時(shí)將所需知識(shí)單元和與其相關(guān)的信息進(jìn)行整合,在最短的時(shí)間內(nèi)獲取最大的信息量。為了最大限度地開(kāi)發(fā)方志資源,多角度、多側(cè)面地深入揭示方志內(nèi)涵,依據(jù)信息時(shí)代人們的信息需求特點(diǎn)和信息網(wǎng)絡(luò)技術(shù)發(fā)展所提供的技術(shù)保證,達(dá)到知識(shí)創(chuàng)新的目標(biāo),因此,方志資源庫(kù)的建庫(kù)模式應(yīng)定位在數(shù)字化信息資源的重組與多媒體展示的平臺(tái)上。在此,先論述圖書(shū)館數(shù)字化和數(shù)字圖書(shū)館之間的聯(lián)系與區(qū)別以及其他幾個(gè)基本概念。
二. 方志資源庫(kù)的幾個(gè)基本概念
1.圖書(shū)館數(shù)字化:從字面上看,傳統(tǒng)圖書(shū)館館藏經(jīng)過(guò)數(shù)字化技術(shù)處理和加工,為用戶提供服務(wù),這個(gè)過(guò)程就叫圖書(shū)館數(shù)字化。這方面的工作我們?cè)谑畮啄昵熬烷_(kāi)始了。例如:八十年代后期我們就在M150機(jī)上編制“國(guó)家書(shū)目”,九十年代前期我們開(kāi)始編制的地方志書(shū)目數(shù)據(jù)庫(kù)及以后編輯的地方志人物傳記索引數(shù)據(jù)庫(kù),直到目前我們還在做的“古籍書(shū)目”數(shù)據(jù)庫(kù)以及我們將要建的地方志資源庫(kù)中的全文影像庫(kù)等都屬于圖書(shū)館資源數(shù)字化的范疇。其工作對(duì)象和結(jié)果僅限于傳統(tǒng)資源本身,或者說(shuō)它只是一種載體形式的轉(zhuǎn)換(由紙制品轉(zhuǎn)化成電子出版物)。
2.數(shù)字圖書(shū)館:數(shù)字圖書(shū)館是把傳統(tǒng)圖書(shū)館的功能由信息的查詢和圖書(shū)資料的借閱擴(kuò)展到知識(shí)服務(wù)的新階段。其中兩個(gè)關(guān)鍵的技術(shù)是信息資源的整合和知識(shí)的創(chuàng)新。前者就是要依據(jù)統(tǒng)一標(biāo)準(zhǔn),將相互關(guān)聯(lián)的信息資源重新組合并進(jìn)行科學(xué)的分類(lèi)和標(biāo)引,強(qiáng)調(diào)重組后的信息資源的有序化和關(guān)聯(lián)性,而后者突出的是知識(shí)的增值與創(chuàng)新。如果把前一過(guò)程比做物理學(xué)中物質(zhì)所發(fā)生的“物理變化”的話,則知識(shí)創(chuàng)新所引發(fā)的就是物質(zhì)的“化學(xué)變化”。即通過(guò)分解、重組,形成了新的信息知識(shí)網(wǎng)絡(luò),較原來(lái)的傳統(tǒng)信息資源在功能、用途等方面都發(fā)生了質(zhì)的變化。對(duì)此許多專(zhuān)家、學(xué)者都有嚴(yán)謹(jǐn)?shù)拿枋龊徒忉?在這里就不一一贅述了。通俗一點(diǎn)兒說(shuō),它有以下幾個(gè)特征。
(1) 信息資源數(shù)字化:數(shù)字圖書(shū)館內(nèi)的所有信息資源都經(jīng)過(guò)數(shù)字化處理。
(2)服務(wù)手段網(wǎng)絡(luò)化:它借助網(wǎng)絡(luò)技術(shù)、計(jì)算機(jī)技術(shù)和現(xiàn)代通信技術(shù)傳播知識(shí)(例如互聯(lián)網(wǎng)、衛(wèi)星傳遞等),突破了館舍的時(shí)空局限,用戶可以隨時(shí)隨地得到所需信息,是不局限于圖書(shū)館場(chǎng)館的。(3)資源實(shí)體虛擬化:它是基于互聯(lián)網(wǎng)的多維知識(shí)網(wǎng)絡(luò),突破了傳統(tǒng)載體的限制,延伸、拓展了傳統(tǒng)圖書(shū)館館藏外延。它不僅提供傳統(tǒng)的基于印刷介質(zhì)的服務(wù),還可通過(guò)跨庫(kù)檢索,對(duì)數(shù)字信息進(jìn)行重新組合,提供重組后的信息服務(wù)。因而,它是對(duì)館藏資源的再開(kāi)發(fā)。例如:“昭陵”和“玄武門(mén)之變”分別是景觀和事件對(duì)象資源,它們都與“李世民”相關(guān)聯(lián),分別收藏在景觀庫(kù)和事件庫(kù)中,但重組在一個(gè)頁(yè)面里,以視頻、音頻、圖像等多媒體手段展現(xiàn)在用戶面前。
(4)檢索方式良序化:依據(jù)統(tǒng)一規(guī)范即統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),對(duì)數(shù)字信息資源進(jìn)行科學(xué)的分類(lèi)和標(biāo)引,達(dá)到對(duì)數(shù)字信息處理的良序化(相當(dāng)于書(shū)刊采訪到館后先編目),保證了分散的數(shù)字資源經(jīng)重組后提供給用戶精確的檢索,檢索效率很高。這一點(diǎn)有別于一般的網(wǎng)絡(luò)搜索引擎。網(wǎng)絡(luò)搜索引擎是通過(guò)網(wǎng)絡(luò)機(jī)器人自動(dòng)搜索并生成相關(guān)的著錄信息,存入數(shù)據(jù)庫(kù)中供檢索之用,其檢索系統(tǒng)由于采用自動(dòng)標(biāo)引,檢索后的網(wǎng)上信息還需要人工識(shí)別處理,檢索效率太低。
(5)信息利用共享化:由于數(shù)字化圖書(shū)館內(nèi)的信息資源的加工、發(fā)布都依據(jù)統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,所以它可以最大限度地實(shí)現(xiàn)信息資源的共建共享。
3.元數(shù)據(jù):傳統(tǒng)圖書(shū)館流程中重要的一步工作就是圖書(shū)、期刊的編目,便于用戶查找。數(shù)字圖書(shū)館中的數(shù)字資源同樣需要編目。元數(shù)據(jù)就是為了滿足數(shù)字資源的編目需要應(yīng)運(yùn)而生的,它是數(shù)字圖書(shū)館編目的新規(guī)則,是一種有效的信息資源組織和管理的工具。它具有描述性、結(jié)構(gòu)性、管理性。就描述性而言,我們以前用的卡片目錄,現(xiàn)在用的MARC格式都屬于元數(shù)據(jù)的范疇。但元數(shù)據(jù)又比卡片目錄、MARC格式具有更強(qiáng)大的描述能力,而元數(shù)據(jù)所具有的結(jié)構(gòu)性(揭示資源的內(nèi)部結(jié)構(gòu))和管理性(規(guī)定運(yùn)行環(huán)境、數(shù)字版本、收費(fèi)情況等)使它能更全面的反映了數(shù)字文檔的各個(gè)方面,為數(shù)字資源的保存和利用提供了更有效的工具。
4.資源庫(kù):經(jīng)過(guò)專(zhuān)業(yè)人員組織、加工、整合而成的符合數(shù)字圖書(shū)館規(guī)范的資源的集合。它具有數(shù)字圖書(shū)館的基本特征。資源庫(kù)是完全網(wǎng)絡(luò)化的,具有強(qiáng)大的檢索平臺(tái)和豐富的檢索途徑。一般資源庫(kù)都包括了文字、圖片、視頻、音頻等豐富的多媒體資料,對(duì)各種媒體都具有良好的支持。各種專(zhuān)題知識(shí)資源庫(kù)組成了數(shù)字圖書(shū)館的物質(zhì)基礎(chǔ)。資源庫(kù)的建設(shè)不可能一蹴而就,它要隨著時(shí)間的推移、知識(shí)的不斷更新,動(dòng)態(tài)地更新內(nèi)容。由于資源庫(kù)的信息資源使用統(tǒng)一的加工、發(fā)布標(biāo)準(zhǔn)(例如元數(shù)據(jù)標(biāo)準(zhǔn)),可吸收各信息資源優(yōu)勢(shì)單位參與共建,形成系列知識(shí)庫(kù)群,使信息資源最大限度地被公眾所共享。
三. 方志資源庫(kù)的結(jié)構(gòu)和內(nèi)容
根據(jù)方志內(nèi)容特點(diǎn)和用戶需求,我們的方志資源庫(kù)設(shè)計(jì)成由一個(gè)全文影像庫(kù),一個(gè)OCR數(shù)據(jù)庫(kù)和八個(gè)專(zhuān)題子庫(kù)組成。
用戶既可通過(guò)全文檢索進(jìn)入全文影像庫(kù)或OCR庫(kù),也可通過(guò)“跨庫(kù)檢索”、“字段聯(lián)接”和“詞語(yǔ)置標(biāo)標(biāo)引”等方式進(jìn)入各個(gè)專(zhuān)題子庫(kù),再通過(guò)8個(gè)專(zhuān)題子庫(kù)跨庫(kù)進(jìn)入全文影像庫(kù)或OCR庫(kù),該方法實(shí)現(xiàn)了不同專(zhuān)題庫(kù)中的字段及字段中的內(nèi)容的鏈接。
1 全文影像庫(kù):就是將國(guó)圖分館所藏的1949年前編纂刊行約6000余種地方志書(shū)進(jìn)行全文掃描,即志書(shū)的數(shù)字化處理,全文影像庫(kù)并沒(méi)有改變?cè)械男畔⒔M織,它只是對(duì)紙制志書(shū)的載體形式進(jìn)行了一次平面轉(zhuǎn)移,即將紙制舊志通過(guò)掃描處
【中國(guó)地方志(舊方志)資源庫(kù)的設(shè)計(jì)與展望】相關(guān)文章:
談?wù)劄榈胤街揪幾敕⻊?wù)的二次文獻(xiàn)工作03-18
方志傳記資料索引數(shù)據(jù)庫(kù)的設(shè)計(jì)與實(shí)現(xiàn)03-19
2006年全球及中國(guó)經(jīng)濟(jì)展望03-19
20世紀(jì)中國(guó)哲學(xué)的回顧與展望03-18
淺談方志類(lèi)論文寫(xiě)作與學(xué)術(shù)規(guī)范12-08