正在查看 21 个帖子:1-21 (共 21 个帖子)
  • 作者
    帖子
  • @15930 回复

    唐象
    游客

    在遇到古本当中有某个生僻字的时候,如果一时难以解决。不妨先搁置,先往下看。因为往往,在后面,如果同样出现这个生僻字,但因为在后文当中,是在一个特定术语里面,所以一猜就能猜到这个字是什么字。然后再反推到前面那个生僻字。

    这样做的好处,是同样的一个本子,用自己本子上的字去解自己本子上的字,最精准。

    如果刚开始就直接采用多种其他方式去查这个字,有时可能要花很多精力才能查到。即便查到,可能有些细节还不一样,不敢一时确定下来。

    @15934 回复

    爱读书
    游客

    感谢分享阅读古籍的技巧,确实经验之谈。

    @15941 回复

    三河冯威
    游客

    @唐象 #15930

    如果 只出现一次呢?

    @15942 回复

    唐象
    游客

    @三河冯威 #15941

    个人常用方法:

    一、https://www.zdic.net/,汉典网,字库比较齐全。

    查询的方法上,对于生僻字,比较常用的有:

    1、右上角「汉字拆分查询」。选择字型结构,然后依顺序输入各个部件,看是否能够查到。如果不行,还有一个技巧。比如左右结构的字,左边不好输入,但右边是确定的。这个时候,输入的时候,不要选字型结构,直接输入右半部分。就会跳出来所有包含这个部件的字,然后再细查。

    2、字典部首索引。这个和以前查新华字典差不多,先确定一个部首,然后看剩下是多少画,再直接到多少画里面去找。要一个一个仔细找。看有没有。

    3、总笔画索引。这个藏得深,要先点到汉语字典,字典检索里,总笔画索引。这个字有多少划,就选到那里。这种情况,适用于特别难查的字。只有通过花更多时间精力,一个一个去找过去。

    二、猜字法。

    根据上下文意,自己尝试去猜一下,字看多了一般会有一种直觉,就是字型比较相近,会天然跳出几种可能的字。然后到汉典输入这个字的简体。

    然后选择“字源字型”,去比对一下,是不是出现了一模一样的生僻字,如果出现了,那说明猜对了。如果没有出现,可能猜错了,或者字库不全。有些字可能字库里都没有。

    三、替换部首法

    有些字的部首,熟悉以后,某个字以前这个部首这样写,换到另一个字,还是这个部首,就可以尝试去替换,看看是不是会有灵感。

     

    个人不常用方法,但思路上应该是可行的。

    一、手写法。用鼠标写出这个字,然后系统可以直接去辨别。信息技术应该是可行的,但只是要找到非常优秀的生僻字查询系统,有这个功能就可以。现在主要不是信息技术问题,而是字库的问题。手机上比如百度输入法等等运用了人工智能技术的输入法,普通字的手写的识别率已经非常高了。

    二、笔划输入法。中华书局古联输入法http://www.ancientbooks.cn/helpcore?input

    其中有直接输入横竖撇捺折,然后找字。但不知字库是否充足。如果字库充足的话,这样去找会方便很多,前提是要掌握正确的书写笔划,可以多试试。

    三、AI识别。AI识别,一定是生僻字识别的未来。http://codh.rois.ac.jp/,这个日本网站,有这样的技术框架。并运用在了古日文的识别上。将来随着AI古汉字识别技术发展,生僻字识别,应该不会是门槛。有待技术人员开发成熟,那会大大降低阅读古籍的文字门槛。

    @15961 回复

    唐象
    游客

    AI图像识别。已经找到了。https://mojizo.nabunken.go.jp/

    上传图像后选择解析,就可以了。

    测试过,效果并不理想。几个较难的字,目前识别不出,简单的字能够识别出来。

    说明技术本身慢慢在成熟,只是字库扩充的问题,这只有靠时间,数据库大了以后,自然准确率就提高了。

    @15962 回复

    三河冯威
    游客

    @唐象 #15942

    谢谢

    @15988 回复

    唐象
    游客
    @15992 回复

    gsyrzjy
    游客

    查字的话,异体字字典比汉典多,国学大师网字典有草书功能

    @15994 回复

    墓鬼
    游客

    我来问一个字,上㑹下足。

    @16001 回复

    gsyrzjy
    游客

    @墓鬼 #15994

    叶典
    拼音kuai3

    𨆝,是后造字。北京方言中有一单词叫作(擓kuǎi.zhe),借用“擓”字,徒步,走着的意思。按理应写作“𨆝”,左‘足’右‘會’(kuài),𨆝应念(kuǎi)。

    异体:(缺字)

    喃字

    ㈠同“𠁚”

    ㈡gối 膝盖。

     

    @16004 回复

    gsyrzjy
    游客

    厉害,第一次知道叶典!异体字典没有该字,汉典有三分之一,国学大师字典有三分之二

     

    @16006 回复

    墓鬼
    游客

    从文义看,不是动词、名词,用𨆝来解释不通。

    @16007 回复

    唐象
    游客

    叶典网:http://yedict.com/

    我测试了一下。上㑹下足。在汉典当中,不论是上下结构,还是左右结构,都找不到。

    但在叶典网,却能够找到。

    果然,最后拼的是大数据。数据库的庞大最重要。信息技术这方面,几乎是差不多的。

    @16008 回复

    唐象
    游客

    @墓鬼 #16006

    那把上下文意发来看看啊。有的时候,要联想的。有的字的解释,可能本身字典里也不齐全都有可能。

    这个时候,要结合上下文意,然后去猜。对于特别生僻的字,可能只有这办法。

    @16009 回复

    唐象
    游客

    用AI图像识别也测试了一下。解析时间比较长,并且最终没有出现任何一个有效结果。

    看来,AI图像识别,虽然特别方便。但是算力不足导致查询时间长,这是一个问题。当然这个问题还尚且可以克服。

    但最要命的,仍然是数据量的问题。数量量太小的话,什么查询方法都没有用。

    如果有AI图像识别+叶典网的大数据。这样将来出现的查生僻字的,一定非常强大。

    @16011 回复

    墓鬼
    游客

    可能是生造字,“會”添“足”,还是“會”字。

    @16014 回复

    gsyrzjy
    游客

    @墓鬼 #16011

    你这好象是宋本,查查同名书的其它版本,比如元本、明本,特别是四库本,还有现代本,说不一定有人把生僻字改成通俗字了

    @16015 回复

    gsyrzjy
    游客

    元明时有一个收俗字最多的书,我忘了

    @16171 回复

    convoi
    游客

    我用IDS找字:https://www.babelstone.co.uk/CJK/IDS.TXT,它覆蓋了標準-擴展G的所有已編碼漢字。

    如果你發現有找不到的字,可以到維基文庫留言給我:

    zh.wikisource.org/wiki/...lk:Jlhwung

    對於古籍中未編碼漢字,我可以聯繫IRG專家進行整理,例如

    wikisource.org/wiki/...BabelStone

    這些字以後都有可能會納入到Unicode編碼中。

    @16174 回复

    未曾
    管理员

    @convoi #16171

    感谢维基大咖~

    @16499 回复

    唐象
    游客

    微软日文输入法,自带手写识别。

    Windows操作系统,安装微软自带的日文输入法后,其中带有一个手写板功能。

    这个手写板,不仅可以用来输入日文,有些复杂的汉字,也可以输入出来。

    比如“叅”字。同“参”字。但是通过其他方式,我没有能够成功找到这个字。最后是通过这个微软自带的日文输入法,手写板功能,成功输入出来了。

     

正在查看 21 个帖子:1-21 (共 21 个帖子)
正在查看 21 个帖子:1-21 (共 21 个帖子)
回复至:「分享」生僻字识别小技巧
您的信息: