电脑技巧收藏家
当前位置:首页>>实用电脑技巧>>正文

图片文件转文本的OCR识别方法

 

 

 

本方法适用于扫描所得的图片型PDF文件的文字识别。

 

1.工具:microsoft office document imaging(Office 2003 工具)Windows程序附件中的画图板。

 

2.图片文件格式:.tif(Tag图像文件格式,tiff)

 

3.步骤:

    A.PDF文件中使用快照工具,选中需要识别的区域。提示选定的区域已复制到了剪贴板,点击确定

    B. 打开画图板,开始--程序--附件--画图,然后点编辑--粘贴--文件--另存为,在保存类型中选择Tiff,然后保存

   C.microsoft office document imaging打开保存的tif文件,开始--程序--Microsoft office--microsoft office工具--microsoft office document imaging”,接下来有两种方法:1)点工具--使用OCR识别文本,然后在运行过OCR的页面上直接复制文字粘贴到Word中即可进行编辑。2)点工具--将文本发送到Word”,去掉在输出时保持图片版式不变前面选择框中的“√”,然后确定,在弹出的Word中选择文字即可进行编辑,识别完成。

  4.注意事项:

   A.PDF原稿越清晰识别效果越好,建议放大到200%使用快照工具。

   B.其他格式图片应先转换为tif格式,用画图板打开然后另存就可以。

   C.使用快照工具时选区边界尽量放宽,避免靠边的字无法正确识别。

   D.支持跨栏选择的文字,识别后段落正常。

   E.使用快照工具时,避免一次选择太大范围,造成死机。

   F.如果识别后全为乱码,注意microsoft office document imagingOCR选项是否为相应语言,工具--选项--OCR--OCR语言(中英文选择)--确定

 

来源:互联网



上一篇:一键GHOST菜鸟教程:安装硬盘版

下一篇:网页文字、CHM文件内容无法复制:用Aqua Deskperience

设为主页 | 加入收藏 | 联系我 | 手机版
免责声明:本站资料来源于互联网,其版权归原作者所有。
如内容涉及或侵犯了您的权益,请通知我!
66998.com.cn版权所有 Copyright©2009  桂ICP备08100152号
建议使用分辨率:1024*768及更高

桂公网安备 45082102000110号