中国几千年来的浩浩典籍按照不同时代、不同地域、不同形式、不同主题融合为一个有机整体,从而使得每一个心念的转动,都能迅速触及每一个文字,如身使臂,如臂使指。随着“微”时代的迅猛到来,数字化已然深入到生活的各个方面,爆炸式信息增长的背后是庞大数据库的支撑。古籍数字化导夫先路,从起始便力求“致广大而尽精微”,如今在迈入“微”时代的同时,也一举跨入了“大”时代。
在本届会议上,首都师范大学电子文献研究所面对“大数据时代”这一潮流,提出了“建设超大规模数据库”的目标,“大数据”不仅仅是一个数量概念,更是一个组织概念,一个从现实延伸到虚拟的时空建构。欲达成建设超大规模数据库这一宏伟目标,建立统一而严密的规范势在必行,这也是本届会议上重点探讨的核心议题之一。此届会议,还设有“文学与资讯技术”海外专场,来自日本、台湾和香港等国家和地区的学者所带来的海上新风,令大会别开生面。数字化给文史研究开辟了迥异于传统的思路和模式,统计学、地理学、地图学等学科的方法和手段也运用得越来越频繁和成熟。
据介绍,随着各种专题古籍数据库纷纷涌现,而原先的一些具有代表性的大型综合性数据库也在不断扩充并日臻完善,向超大型转换。以首师大电子文献所研发的《国学宝典》为例,2000初建时收书不过数百种,现今的规模已达6000余种,20万卷,20亿字,到明年还将增至1万种,矢志建成真正的“万有书库”。
在上届会议上演示并引发关注的自动标点、自动比对、自动排版三大核心技术,至本届会议时也已更加成熟,并在古籍整理出版中充分发挥作用,显现其强大的功能。2012年初,继《二十四史》整理出版项目之后,首师大电子文献所又启动了《中华易学全书》整理出版项目,并利用现代制图软件将古老的易图制作成为高清矢量图,建立起一套完整的易学图库,开拓了“国学图典”的新天地。
在上届会议上演示并引发关注的自动标点、自动比对、自动排版三大核心技术,至本届会议时也已更加成熟,并在古籍整理出版中充分发挥作用,显现其强大的功能。2012年初,继《二十四史》整理出版项目之后,首师大电子文献所又启动了《中华易学全书》整理出版项目,并利用现代制图软件将古老的易图制作成为高清矢量图,建立起一套完整的易学图库,开拓了“国学图典”的新天地。
据了解,“中国古籍数字化国际学术研讨会”于2007年、2009年、2011年已先后举办了三届,并由中国大陆、港澳台地区及日本、韩国等国家的学者共同发起的“文学与资讯技术国际研讨会”也已成功举办五届,而今又隔两载,在历史的长河中虽然只是短短一瞬,但对于古籍数字化的发展来说,却是一个至关重要的阶段。