Readiris Corporate教程:提高识别文档准确性介绍
Readiris 在识别阶段应用语言学来识别文档。因此,Readiris 可识别所有类型文档中的文本、表格、图形、条形码和手写文字。Readiris 甚至能够处理复杂的分栏文档、低品质文档、传真、点阵式打印稿、包含过亮或过暗字体形状的扫描/复印不佳的文档等。
Readiris 支持 128 种语言:它支持所有美洲和欧洲语言,包括中欧、波罗的语和使用西里尔字母的语言,以及希腊语和土耳其语。Readiris 可以随意地读取阿拉伯语、波斯语和希伯来语文档以及四种亚洲语言 - 日语、简体中文、繁体中文和韩语。Readiris 甚至还能处理混合的字母:本软件可检测希腊语、使用西里尔字母的语言、阿拉伯语、希伯来语和亚洲语文档中出现的“西方”单词 - 许多无法誊写的专有名词、品牌名称等都是以西方符号书写的。
Readiris 采用的是最先进的识别技术。独立于字体的文本识别与自学技术相得益彰。通过上下文和语言学分析,系统能够学习新的字符和单词。这意味着识别系统的 OCR 准确度将随着用户使用而提高。
此外,Readiris 还有(可选的)用户验证功能。启用后,用户验证功能(互动学习)不仅标记识别系统不确定的字符,还可提高系统的准确度。识别过程中将临时记住您确认的所有解析,从而提高系统速度和置信度,使系统随着您的使用变得更加智能。这一强大的学习工具还允许您训练 Readiris 学习诸如数学符号和图像符号之类的特殊字符,以及处理变形的字体。
互动学习结果还可以永久地存储在字体库中以便将来使用。
来源:互联网
上一篇:Readiris Corporate教程:设置文档语言 下一篇:Readiris Corporate教程:设置识别窗口模板
|