高速扫描仪,书籍扫描仪-方圆智能科技有限公司
收藏本站 | 设为首页 | 联系电话:400-616-0007
您的位置:首页 >> 新闻中心
古籍数字化成本高:一页古籍数字化人工6块多

  古籍数字化成本高:一页古籍数字化人工6块多

 

  你知道珍贵古籍是怎样进行古籍数字化的吗?苏州图书馆副馆长汪建满透露了从古籍扫描仪扫描图片到人工录入文字再到校对、生成数据库等的全过程。

软件没法用,文字只能人工输

古籍的档案数字化加工,离不开相关的软件系统。为此应运而生了古籍数字化软件系统。

古籍数字化软件系统是将数字素材加工成数据库的操作平台,古籍的页面原貌图片和文字,还需要一一扫描和输入。

为了保护古籍,书页图片需要用冷光源书刊扫描仪古籍扫描仪非接触式扫描仪全自动扫描仪进行扫描,扫描完了还要用软件加工修正。

文字的录入难。古籍上的文字,往往因不按标准写法刻制而很难辨认,像己、已、巳,曰、日,人、入、八……一旦刻得不够规矩,OCR文字识别软件就会判断错误,导致输入电脑的字出错。而古籍中这样的字很多,此外还有大量异体字,所以即使是比较好的本子,录入文字的准确率也不过93%,一般只有70%左右,手抄本就没法说了。而一旦准确率低于97%,使用这种录入法的意义就不大了。汪建满解释,这是因为校对会特别烦,还不如手工录入。

  正因为这样,古籍数字化软件是用两名输入员进行录入的,然后再用电脑软件进行自动比对,一旦出现不同,软件系统就会把不同的字自动翻红,这样就容易发现问题、及时更正了。

  遭遇冷僻字,求助超大字符集

  如果说,上面提到的做法只是烦一点的话,那么,碰到冷僻字就不只是烦的问题了,而是简直让人无从下手。

  例如:葑门的葑又叫鱄门鱼孚门,是因为(鱼孚)”跟随波涛进入而得名的,可在普通字库里,鱼孚字根本打不出来。

  难办的是,古籍上有些冷僻字甚至连收字4.8万多的《中华大字典》也查不到。

  只好用带造字工具的windows软件自己造字,很麻烦。方正超大字符集和台湾的细明体超大字符集软件,这两大系统收录的汉字多达7万多,这样以后碰到冷僻字就有办法了,多亏这些超大字符集啊!

  三名熟练工忙一天,只能录入1万字

  古籍文字进行人工录入后,还要进行一校和二校,目的只有一个,就是尽可能少出差错!对古籍负责。

  从页面扫描、文字录入到校对、生成数据库等,花费工夫非常大。他们曾测算过,三名熟练工作人员忙一整天,也只能录入1万字。平均下来,一页古籍人工成本要6元多。如果算上房租费用、水电费和软件开发费。徐伟国说,当年光是古籍数字化软件开发,就花了30多万元。

 

   方圆智能是档案设备提供商,是档案数字化服务商,是多款德国高端书刊扫描仪中国区域的独家代理,可为您提供数字化解决方案,在位于北京市朝阳区北四环中路8号汇欣大厦B座的产品展示及销售部有非接触式书刊扫描仪展示,幅面从A1-A3,价格从188万-58万不等。欢迎您莅临参观测试!

 

 

就因为特别费人工,所以苏州图书馆方面定的目标任务是每年完成5万页、约1千万字的古籍数字化。实践下来,每年都会超额完成任务,汪建满相信,随着时间的推移,一定会有古籍文献让大家轻松查阅。

企业简介  |   荣誉资质  |   联系我们  |   友情链接
地址:天津武清开发区新兴路1号北欧绿色产业园6号厂房2层 邮编:100101 热线咨询:010-84980609 总机:010-84980609
方圆智能科技   京ICP备11024537号
友情链接:
  •