5000余万册古籍数字化完成尚不足一半 如何加速?

2016年06月23日 08:33    来源: 人民日报     张 贺

  原标题:与时间赛跑,古籍数字化如何加速

  

  民族记忆 精神家园——国家珍贵古籍特展6月21日在国家典籍博物馆开幕。资料图片

  古籍为何要数字化

  今年1月在听到某邻国宣布研制成功氢弹的消息后,国家图书馆副馆长、国家古籍保护中心副主任张志清的心一下子提了起来,他担心的是保存在辽宁省图书馆内的清代皇家藏书“天禄琳琅”的安全。辽图所藏的“天禄琳琅”古籍共35部,其中一半是宋元善本,多为海内孤本,极为珍贵,如宋蜀刻大字本《礼记》、《韵补》的唯一存世宋版、三部传世宋版《续资治通鉴长编》中最完整的一部等。

  “这种担心不是杞人忧天,保不齐哪一天灾难降临,我们民族文化命脉的一部分就没了,所以一定要有万全之策。”张志清说。

  为了保护古籍这一记载着中华民族历史文化、塑造了中华民族灵魂的宝贵遗产,2007年1月国家正式实施中华古籍保护计划,古籍数字化工作也是其中的一项重点。经过普查摸底,各地上报的古籍藏量总数达5000余万册(件),共计20余万种,古籍收藏单位达到2800家。其中,国家图书馆作为我国古籍保护的领军者,无论是收藏数量还是质量,都占据首位。国家图书馆现收藏了280多万册(件)古籍,其中宋元善本1600多种,占全世界宋元善本总量的一半。《敦煌遗书》《赵城金藏》《永乐大典》《四库全书》等享誉世界的珍贵古籍被誉为国图“四大镇馆之宝”。

  张志清说:“国家图书馆收藏了全国古籍品种的60%、版本的80%。如果哪一天灾难不幸降临到国图头上,对我们国家古籍来说就是毁灭性打击。所以除了大规模开展古籍影印出版和缩微之外,还要加快古籍数字化。数字化是保护古籍最快、最经济的办法。一部书只有化身千百,才能保存下来。”

  令张志清着急加快古籍数字化的原因还有“书在老化”。据国家图书馆2007年前后进行的检测,馆藏古籍纸张pH值平均只有6.1,大于或等于7的比例仅占8%,需要对古籍进行脱酸、去酸和防酸化处理,否则一旦古籍的pH值下降到5,将面临严重的酸化情况,后果严重。

  “古籍数字化还解决了保护与使用的矛盾。毕竟古籍是珍贵文物,翻看的次数是有限的,不能我们这代人有的看,子孙后代没的看。数字化以后,(读者)就不必去图书馆,在家里就能上网查看了。”张志清说。

  经过中华古籍保护计划近10年的建设,现在各地古籍保护的条件有很大改善,古籍安全基本有保证,但中外历史经验都证明,稍有不慎,古籍仍会遭遇灭顶之灾。2015年1月30日晚,位于莫斯科西南部的俄罗斯科学院社会科学信息研究所图书馆突发火灾,约有200万册文献资料遭到损毁。俄罗斯科学院院长称“这是俄罗斯科学界的切尔诺贝利事件”。国家古籍保护中心为此专门下发了一期简报,要求各地古籍保护中心要以此为戒,加强检查,排除安全隐患。

  三方合力推进古籍数字化

  古籍数字化目前主要有三种方式,一是原样数字化,即按照古籍的原貌原样扫描或影印、最大限度地保存古籍历史信息;二是文本式数字化,即将古籍全文录入整理成可检索的数据库;三是知识型数字化,即按照知识管理的模式对古籍数据库进行标引等深度加工。

  “对公共图书馆而言,所做的工作主要是第一种。有一些企业在做第二种数字化。”张志清介绍说,目前国家图书馆等公共图书馆和高校图书馆普遍利用馆藏资源进行数字化开发,如国家图书馆开发的数字古籍善本、碑帖精华、甲骨世界、西夏碎金、年画撷英等提供了馆藏古籍、碑拓、甲骨等文献的影像,读者不必到馆即可在网上浏览。

  一些高校科研单位也在从事古籍数字化工作。北京大学图书馆建设有“秘籍琳琅——北京大学数字图书馆古文献资源库”,是完整展示北京大学图书馆藏古籍的网络平台,读者可以在其上检索北大图书馆藏全部各种类型古文献元数据,查看和浏览古籍书影、电子图书,以及拓片、舆图图像。北大馆牵头建设的“学苑汲古——高校古文献资源库”,更是汇集了包括北大图书馆在内的国内24所高校图书馆藏古籍元数据60余万条、书影20余万幅,电子图书8.35万册,是目前世界上规模最大的古籍书目数据库之一。

  商业公司开发的古籍数据库是古籍数字化的重要组成部分。以北京爱如生技术公司为代表的企业开发的大型古籍数据库如“文渊阁四库全书”“中国基本古籍库”“中国方志库”“中国历代石刻史料汇编”“四部备要”“古今图书集成”等,规模庞大,检索方便,很受图书馆和读者的青睐。据统计,截至2012年,我国公藏机构已经拥有超过20亿字的数字化文本格式的古籍。可以说,目前常见古籍基本上都能在互联网上找到数字化格式。

  但正如一些学者所指出的,全文化的古籍数据库虽然方便检索,但准确性不够,在论文、著作中征引文献时,仍要使用公认的权威版本的纸书。北京大学中文系教授、全国高校古籍整理研究工作委员会办公室主任卢伟说,在最近几年的硕士博士生论文答辩中,经常出现征引文献出错,一问都是使用古籍数据库造成的。

  “当前商业性的古籍数据库存在贪大、求全的倾向,虽然检索方便,但准确性不足是其硬伤,今后应该重视数字善本的建设,要让读者拿来就能用,敢于征引。”中华书局总编辑顾青说。

  今年“4·23”世界读书日期间,中华书局推出了“中华经典古籍库”微信版。这个包含896部古籍、5亿字的古籍库就规模而言不算大,但就其准确性而言,则是其他商业性古籍数据库难以比肩的。顾青说,“我们的古籍库是基于几代学者整理点校的版本,体现了新中国古籍整理的最高水平,可以成为读者信赖和依据的本子,这一点是我们的优势。”

  据顾青介绍,新中国成立以来整理出版的古籍近3万种,其中古籍整理类约1万种,古籍影印类约4000种,古籍普及类约1.5万种。另外,民国时期整理的古籍还有1万多种。但这些点校本的版权分散在全国几十家古籍出版社和社科出版社,“我们也希望能把他们出版的较好的古籍点校本纳入中华经典古籍库,但不少地方出版社想自己搞数字化,不太愿意把版权拿出来。”顾青认为,如果各出版社单打独斗,就会出现数十个小型古籍数据库,难以形成规模优势。

  破解统筹与资金难题

  业内人士指出,当前古籍数字化缺乏国家标准,各单位之间缺乏科学统筹和协商合作,多为独立地进行开发,导致内容重复且质量良莠不齐。据统计,《文渊阁四库全书》有3种电子版,《二十五史》的数字化版本竟然有7种。重复劳动无疑将造成人力、物力、财力的极大浪费。张志清说:“5000多万部古籍不可能也没必要全部数字化,但是20万种50万个版本的古籍值得全部数字化,这项工作如果完成了,中国传统文化的传承和文化安全就有了根本保障。中华古籍就能够避免历代皇家藏书盛世收集、衰世流散、乱世毁灭的命运。”

  据估算,汉文古籍20万种50万个版本,其中已经数字化的大概有10万种15万个版本。“大量的工作还没有做,其中包括少数民族的古籍,比如西藏萨迦寺保存了从元代至今不断抄写的藏文佛教经典。如此系统的图书收藏在汉地已经没有了。所有这些古籍都需要加快数字化。”张志清说。

  此外,海外中华古籍的数字化也是推动古籍回流的重要方式。今年4月28日,国家图书馆接受法国国家图书馆赠送法国藏《圆明园四十景图》数字版本,这是国家图书馆实施“海外中华古籍调查暨数字化合作项目”以来取得的首个重要成果。《圆明园四十景图》原存于圆明园,1860年被英法联军抢掠。国家图书馆积极联系法国国家图书馆,反复沟通协商,最终双方达成捐赠数字版权协议。

  据统计,海外100余家收藏机构藏有中华古籍300余万册,不仅数量巨大,而且很多是孤本,具有极高的文献价值与文物价值。近年来,国家图书馆以及中华书局等通过多种方式调查散落在海外的中华典籍,并尝试与海外存藏单位合作,以数字化的形式使这些优秀典籍回归祖国。

  但古籍数字化的最大困难在于资金。国家古籍保护中心每年的资金是2500万元,专门用于数字化的经费比较紧张。卢伟也表示,“高校古委会每年的经费仅有1000万元,要支持全国20多所高校古典文献专业的发展,专门用于古籍数字化项目的经费很少。而且古籍数字化都是大项目,几百万元可能也不够。”

  “20万种古籍全数字化可能需要几十亿元,并不算多。”张志清认为,在国家财力允许的条件下,应尽快集中力量实现全部重要古籍的数字化。他以《永乐大典》为例,这部世界上最庞大的百科全书在编成后因明成祖嫌“工费浩繁”而始终没有刊印过,无论是“永乐正本”还是“嘉靖副本”都是抄本,结果因火灾和战乱最终消散,11095册原书存世者仅370余册。

  张志清说:“当年如果永乐皇帝舍得拿出钱来多刊刻几部,也许今天我们就能见到全书了,七八千种宋元古籍我们就都能看到了,中华文脉从宋代以来就连上了。我们对中国历史和文化的认识也许就是另一个高度。《永乐大典》的命运是文脉传承的一个教训,到时候该印出来就赶快印出来,该数字化就尽快数字化。”

更多精彩内容,请点击进入文化产业频道>>>>>

(责任编辑: 张晶雪 )