正在查看 7 个帖子:1-7 (共 7 个帖子)
  • 作者
    帖子
  • @12164 回复

    唐象
    游客

    前文:超低成本,打造一整套古籍工作流。包括古籍采购、电子化、校对、翻译等环节。

     

    一、采购

    古本的采购,主要是两个网站。

    1、国内:孔夫子旧书网 www.kongfz.com/

    国内是孔夫子旧书网。搜索关键词,就可以找到一些或者是在我国的古籍,或者是流传至海外但近年又重新回归到本国的古本。一般是有专门的书商去国外采购回来,然后挂在孔夫子旧书网上再次销售。一般会网购,就会采购古本。

    这里要注意的是,因为古本一般都不便宜。所以在采购前,应尽量寻找免费的电子版,如果已经有了免费的电子版,再去采购就会白白浪费很多的财力。

    还有一点。那就是鉴别能力。这个需要在专业领域深入学习才可能培养出鉴别能力。就是这一本古本,到底是真本还是伪本,其内在文字的价值,可能是多少。这都需要去鉴别。这个能力是不可能短期培养出来的,需要在一个特定领域长期耕耘才有可能。

    2、日本:日本の古本屋 https://www.kosho.or.jp/

    如何从日本直接请购古籍。可以专门再写一篇文章。此处从略。

     

    二、扫描

    黑科技:曲面展平技术。

    简单解释曲面展平技术,就是不需要拆封,就能把书扫出拆封的效果。

    这里已经说了是超低成本。如果要购买专门的曲面展平扫描仪的话,是1299-1499元。

    成者(CZUR)智能扫描仪 Aura系列
    如果是一个团体,拥有大量图书,为了提高效率,建议购买一个这样的扫描仪。会方便很多。

    但如果是个人工作室,在经济情况又不好的情况下,并且一本书就够研读很久的话。那么完全没有必要专门为此买个专业的黑科技扫描仪,然后吃灰很久。

    这里强烈推荐一款配套的APP,叫“极简扫描”。可以自己去应用商店寻找。

    然后再配个读书架。就可以自己打造一个简单的扫描仪了。有手机就可以了。直接可以在软件内实现曲面展平。

     

    三、PDF格式

    本身极简扫描就带有这个功能。这里强烈推荐的软件是:万彩办公大师。

    里面的PDF功能真的非常好用,并且是免费的。

     

    四、OCR

    考虑到成本等各方面。如果不用考虑成本的话,功能最好的应该是ABBYY的。但是成本太高了。这里强烈推荐的是:白描。

    识别率真的还可以。软件操作细节这里从略。请自行探索。

     

    五、校对

    这里没有什么好多讲的,只有老老实实去校对。

     

    六、翻译

    翻译主要有两款可以参考。

    一、有道

    二、Deepl

    比较下来,目前在翻译质量上,还没有能够与Deepl比肩的。

    但Deepl翻译,显然还是不够的。但是可以为进一步的翻译打下坚实基础。

     

    这里只是简单介绍。相信有了这份指南,起码会有方向,很多弯路不用走。但具体每个环节如何去做。可以自行探索。

    @12169 回复

    未曾
    管理员

    @唐象 #12164

    感谢先生分享。

    @18601 回复

    ml123
    游客

    @唐象 #12164

    请教一下,这个“白描”可以OCR整个PDF文件吗?没有看到其Windows 应用程序。

    @18606 回复

    唐象
    游客

    @ml123 #18601

    直接OCR整个PDF文件,可能是不行的。但是针对图象文件有批量OCR功能,白描APP确实没有windows程序,是手机端。
    这篇分享写的时间较早,在后来,又发现了一些其他OCR的方式,提供出来供参考。

    龙泉寺开发的一套专门用于古籍OCR的系统,并且似乎是免费供研究使用的:

    古籍 OCR 2.0:

    链接: pan.baidu.com/s/1Vg...g2AXNQqf-Q 提取码: p41p

    如果该链接失效了,请关注公众号:xianchaofashi(贤超法师),然后发送 “OCR”,就可以得到下载链接。

    @18607 回复

    唐象
    游客

    @唐象 #18606

    链接地址是:https://pan.baidu.com/s/1VgaCRGqSlJbNg2AXNQqf-Q#list/path=%2F
    提取码: p41p

    @18625 回复

    ml123
    游客

    @唐象 #18606

    感谢!古籍OCR先保存。我去白描网站试用了网页版批量扫描,OCR效果非常好,速度也快!而且可以当场汇总对照校队,非常方便。我是用UnicornViewer 手工选择PDF文件页面区域输出成图像文件,也可批量输出。这两个工具组合使用,可以快速高质量地输出OCR文本。

    @18672 回复

    唐象
    游客

    @ml123 #18625

    感谢分享。原先压根不知道白描已经出网页版了。你这个流程非常好,高效。

正在查看 7 个帖子:1-7 (共 7 个帖子)
正在查看 7 个帖子:1-7 (共 7 个帖子)
回复至:超低成本打造古籍编辑工作流
您的信息: