关于古籍出版数字化的思考

本文在阐述古籍出版数字化现实意义、发展必要性的基础上,分析古籍出版数字化需遵循的原则和标准,进而提出如何进行古籍数字化

毕业论文网   古籍是记录文化历史遗产的介质,现今的古籍由于历史的变迁存留的数量已经不多了。

信息化技术发展很快,古籍数字化已经比较常见,运用科技技术将古籍保存在计算机系统中,更好地保护了古籍的完整性。

一、古籍数字化的意义   古籍整理是一个细致化和学术化的过程,在古籍数字化之前,古籍的整理出版受时间和空间的限制,也受到保存条件的限制,使得古籍出版的产出量跟不上时代的发展。

古籍数字化古籍原本的保护和内容的传承意义巨大。

古籍出版数字化利用古籍出版数字化系统能够充分挖掘出古籍载体的文化价值和史料价值,从而实现对古籍出版资料的有效利用。

同时将古籍的藏与用的问题良好解决,运用数字化系统将古籍史料价值和文化价值实行有效的分离,充分显示出古籍资料的多样化价值。

另外,古籍数字化也减少了人们和原古籍的直接接触,在很大程度上减少了人们对原古籍的破坏,更好地实现原古籍的长期保持目标。

二、古籍数字化的原则和标准   古籍数字化的工作是非常系统化的,要在一定的基层原则指导下,再进行有效的系统工作。

其一,要按照古籍的整理原则进行古籍数字化的工作。

其二,将有效保护和充分利用相结合来进行古籍数字化的工作。

古籍的文化价值和史料价值的分离可以通过数字化来实现。

运用数字化可以提高古籍的使用率,这样符合古籍的利用条件;运用数字化传播古籍内容避免接触古籍原版,减少了古籍的破坏率,这也符合古籍的保护条件。

其三,严格遵循统一规划系统开发的原则进行古籍数字化工作。

在对古籍数字资料管理的同时要充分调动各个部门之间的关系,实现协调化的古籍管理,在最大程度上避免古籍资料浪费情况的发生。

同时,还可以建立有关小组对古籍资料进行统一化的分类、整理。

其四,必须坚持统一著录标准的原则进行古籍数字化工作。

古籍数字化资源共享的基础和古籍机读目录的建设就是编制标准的古籍目录,只有进行深入地标记引入和严格规范控制的数据库才能拥有良好的资源再生,现实的知识是通过再生资源的有效筛选和编排发现的知识。

三、如何进行古籍数字化   从全球范围来说,古籍数字化是大势所趋,如欧美Gale、Adam Mathew等电子文献出版公司已经专门研发了大型电子古籍数据库,他们既有EEBO(15至17世纪珍本英语文献全文线上资料库)、ECCO(18世纪英文古典文献全文线上资料库)等大型的综合型数据库,也有很多专业化细分的资料库。

对比而言,我国的古籍数字化需要做的工作还很多,总的来说需要从下面几个大的方面入手。

(一)注重古籍数字化传统出版结合的复合出版模式   古籍数字化作为保护古籍原本和利用内容的新途径,是目前大势所趋,但是古籍数字化也具有小众化、专业性的特点,因此古籍数字出版需建立在与传统纸质出版彼此结合的出版模式上,即数字出版推动传统出版的多品种开发传统纸质出版数字出版提供内容,这两种出版模式都有成功案例,《中华书局古籍语料库系统》和《汉达文库》是这两种模式的代表。

1.传统出版数字出版提供内容

中华书局开发古籍数字出版项目《中华书局古籍语料库系统》就是其中的代表性案例。

这项古籍数字出版项目建立在该社已经出版过的古籍出版资源进行数字化加工,从而建成中华古籍语料库

中华书局古籍语料库系统》整个项目大致分成数据采集子系统、原始语料预处理子系统、专家标注子系统、浏览笺注子系统等六大系统。

它是目前质量最高的古籍数字资源,已经应用到中华书局经典古籍的再版制作与文本自动化处理中,是传统出版数字出版相结合的复合型出版模式的成功探索。

2.数字出版推动传统出版的产品开发

汉达文库》是香港中文大学刘殿爵中国古籍研究中心开发的中国古代传世文献及出土文献综合全文数据库,这个数据库共包括先秦两汉南北朝一切的传世文献,并不断扩充数据库内容

汉达文库》按文献性质提供各种简介说明及检索方式,甲骨、简帛、金文还附有图版影像,在此数据库平台基础上,出版了系列古籍丛书《汉达古籍研究丛书》《先秦两汉古籍逐字索引丛刊》《魏晋南北朝古籍逐字索引丛刊》。

汉达文库》古籍数字化出版平台真正实现了传统出版数字出版的相互对接,互为利润增长点。

(二)注重古籍数字化的特色和专业化   我国历史悠久,有浩瀚的古籍资源,由于各种原因,这些古籍被保存在许多不同地方、不同部门。

每个保存单位都会有一些自己特有的专题类型,因此,在做古籍数字化的时候,应该仔细研究精读自己的所藏内容,分类整理,首选突出自己特色的内容来做,避免重复化。

同时也应该仔细选取数字化所用底本,最好选择善本来做底本,并且在开发过程中,由专业的文献学学者全程参与,对古籍中出现的相关名词加以必要的标注,对古籍文本的复杂性要有清楚地认识,尽可能要精通古籍整理的专业学者和数字化相关技术专家通力合作,并采取标准化、规范化的程序来进行古籍数字化选题的开发、运作。

(三)共同开发,资源共享   古籍数字化开发目前有不少成果出现,各种数字化产品中,内容大量重复。

这种重复不仅存在于一些小规模带有普及性的电子书制作上,同样也存在于一些大型的数字化工程中。

最明显的例子是《二十五史》,几乎称得上数字化项目的产品都全部或部分包含了它们。

这种重复在人力和财力上都是一种浪费,它提高了开发成本,相应减少了对其他可开发项目的投入。

造成这种重复的原因,除了有些文献本身属于基本的典籍,制作单位需要利用它们获得基本的用户外,资源共享上的隔膜恐怕也是一个重要原因。

特别是在电子文献资源、技术资源和信息资源上的共享上,这种隔膜对更多更好项目的开发是相当不利的。

这方面的例子可以列出许多,如《四库全书》原文图像版就有两种,超星图书馆和国家图书馆及其他公共图书馆在图书内容上都有大量重复。

2 次访问