- 作者帖子
唐象游客前文:超低成本,打造一整套古籍工作流。包括古籍采购、电子化、校对、翻译等环节。
一、采购
古本的采购,主要是两个网站。
1、国内:孔夫子旧书网 www.kongfz.com/
国内是孔夫子旧书网。搜索关键词,就可以找到一些或者是在我国的古籍,或者是流传至海外但近年又重新回归到本国的古本。一般是有专门的书商去国外采购回来,然后挂在孔夫子旧书网上再次销售。一般会网购,就会采购古本。
这里要注意的是,因为古本一般都不便宜。所以在采购前,应尽量寻找免费的电子版,如果已经有了免费的电子版,再去采购就会白白浪费很多的财力。
还有一点。那就是鉴别能力。这个需要在专业领域深入学习才可能培养出鉴别能力。就是这一本古本,到底是真本还是伪本,其内在文字的价值,可能是多少。这都需要去鉴别。这个能力是不可能短期培养出来的,需要在一个特定领域长期耕耘才有可能。
2、日本:日本の古本屋 https://www.kosho.or.jp/
如何从日本直接请购古籍。可以专门再写一篇文章。此处从略。
二、扫描
黑科技:曲面展平技术。
简单解释曲面展平技术,就是不需要拆封,就能把书扫出拆封的效果。
这里已经说了是超低成本。如果要购买专门的曲面展平扫描仪的话,是1299-1499元。
成者(CZUR)智能扫描仪 Aura系列
如果是一个团体,拥有大量图书,为了提高效率,建议购买一个这样的扫描仪。会方便很多。但如果是个人工作室,在经济情况又不好的情况下,并且一本书就够研读很久的话。那么完全没有必要专门为此买个专业的黑科技扫描仪,然后吃灰很久。
这里强烈推荐一款配套的APP,叫“极简扫描”。可以自己去应用商店寻找。
然后再配个读书架。就可以自己打造一个简单的扫描仪了。有手机就可以了。直接可以在软件内实现曲面展平。
三、PDF格式
本身极简扫描就带有这个功能。这里强烈推荐的软件是:万彩办公大师。
里面的PDF功能真的非常好用,并且是免费的。
四、OCR
考虑到成本等各方面。如果不用考虑成本的话,功能最好的应该是ABBYY的。但是成本太高了。这里强烈推荐的是:白描。
识别率真的还可以。软件操作细节这里从略。请自行探索。
五、校对
这里没有什么好多讲的,只有老老实实去校对。
六、翻译
翻译主要有两款可以参考。
一、有道
二、Deepl
比较下来,目前在翻译质量上,还没有能够与Deepl比肩的。
但Deepl翻译,显然还是不够的。但是可以为进一步的翻译打下坚实基础。
这里只是简单介绍。相信有了这份指南,起码会有方向,很多弯路不用走。但具体每个环节如何去做。可以自行探索。
未曾管理员@唐象 #12164
感谢先生分享。
ml123游客@唐象 #12164
请教一下,这个“白描”可以OCR整个PDF文件吗?没有看到其Windows 应用程序。
唐象游客@ml123 #18601
直接OCR整个PDF文件,可能是不行的。但是针对图象文件有批量OCR功能,白描APP确实没有windows程序,是手机端。
这篇分享写的时间较早,在后来,又发现了一些其他OCR的方式,提供出来供参考。龙泉寺开发的一套专门用于古籍OCR的系统,并且似乎是免费供研究使用的:
古籍 OCR 2.0:
链接: pan.baidu.com/s/1Vg...g2AXNQqf-Q 提取码: p41p
如果该链接失效了,请关注公众号:xianchaofashi(贤超法师),然后发送 “OCR”,就可以得到下载链接。
唐象游客@唐象 #18606
链接地址是:https://pan.baidu.com/s/1VgaCRGqSlJbNg2AXNQqf-Q#list/path=%2F
提取码: p41p
ml123游客@唐象 #18606
感谢!古籍OCR先保存。我去白描网站试用了网页版批量扫描,OCR效果非常好,速度也快!而且可以当场汇总对照校队,非常方便。我是用UnicornViewer 手工选择PDF文件页面区域输出成图像文件,也可批量输出。这两个工具组合使用,可以快速高质量地输出OCR文本。
唐象游客@ml123 #18625
感谢分享。原先压根不知道白描已经出网页版了。你这个流程非常好,高效。
- 作者帖子
正在查看 7 个帖子:1-7 (共 7 个帖子)
正在查看 7 个帖子:1-7 (共 7 个帖子)
正在查看 7 个帖子:1-7 (共 7 个帖子)