能识别钟鼎文,智能文字识别技术亮相世界人工智能大会
刻在甲骨和钟鼎上的文字,如何辨识?
以前,这是考古学家、语言学家需要应对的挑战,但如今有了AI的赋能,普通人也能成为“博学古今”的语言翻译大师。
在世界人工智能大会主会场,一只青铜鼎出现在合合信息的展台。本文图片均为 澎湃新闻记者 俞凯 图
8月31日,澎湃新闻(www.thepaper.cn)记者在世界人工智能大会主会场探营时发现,继去年的甲骨文识别之后,参展元宇宙核心展的合合信息又将智能文字识别技术应用到了难度更高的钟鼎文(金文)识别上。
在一只内部刻有绿色钟鼎文的青铜鼎器上,架起了两根小型滑轨,迷你的智能识别设备可左右移动。
记者在展台上看到,在一只内部刻有绿色钟鼎文的青铜鼎器上,架起了两根小型滑轨,随着迷你的智能识别设备的左右移动,在没有人工干预的状态下,原本处于内凹状态的钟鼎文被拉平,并被转译成简体字显示在上方的屏幕里,“克曰穆朕文且師華父悤譲氒心宁静于猷淑哲氒”等原本连在一起的复杂语句,也经过“AI断句”功能自动处理后,被区分开来,方便大众理解。
合合信息参展人员告诉澎湃新闻记者,在钟鼎文的处理过程中,重点展示了智能文字识别技术的应用,通过以“弯曲矫正”为代表的智能图像处理、基于深度学习的复杂场景文字识别、自然语言处理(NLP)等三大核心技术层,来精准实现复杂场景中的多语言识别。
与常规文本相比,钟鼎文字形小而细密,其载体青铜鼎面存在弯曲、反光、凹凸不平的状况,识别难度极大。这次展示的图像处理技术可有效解决多种弯曲文档图像的矫正问题,还可精准处理拍摄电子屏时出现的摩尔纹以及阴影、图片模糊等现代文本图像处理中常见的干扰状况,让图像看起来更清晰,也为接下来的文字信息提取、识别创造了良好的条件,为我们研究远古时期人类的生产生活、历史演变提供了重要的参考。
参展人员告诉记者,基于不同场景中的文档识别需求,他们推出了智能文字识别训练平台,可识别上百种卡证、票据、行业单据内容。在C端应用中,智能文字识别技术已落地在扫描全能王APP的扫描证件、拍图识字、试卷作业、扫描书籍等多项功能上,常规的印刷体文档字符平均识别率达到99.77%, 手写体文档字符平均识别率为 97.00%。
AI的智能识别技术,还有一大神奇功能,就是对“PS篡改”具有火眼金睛般的检测能力,一切修改TA都知道。
很多人都知道,诈骗团伙在行骗过程中,经常会使用PS过的材料来进行伪装,从个人证件、票据到各类商业材料,受害者不计其数。合合信息此次带到世界人工智能大会的智能图像处理技术,主要采用神经网络捕捉图像在篡改过程中留下的细微痕迹,基于百万级的数据,学习图像被篡改后统计特征的变化,不仅可以判断图片是否被篡改,还能定位修改区域,以热力图形式展示图片的PS区域篡改置信度,检测准确率远超传统技术方法和人眼判断。该项技术可对身份证、护照、行驶证、驾驶证、港澳通行证等证照类别,以及增值税发票、普通发票、医疗发票、小票、合同等多种文档类别进行检测,可广泛应用于保险、银行、证券、政务等多种场景。