文章简介
适用机型:适用于 v5.x 版本的驱动软件
本文以在 Windows 操作系统下使用 CUE 5.3 进行 OCR 文字识别为例,介绍了如何使用一体机随机软件 "HP 解决方案中心 " 来进行文字识别的方法及注意事项。
什么是文字识别 ?
如果您有张稿件,仅仅是为了保存到电脑里备份,通常会用一体机或扫描仪扫描到电脑里成一幅图,如 " 合同 .jpg " 文件什么的。这样成图文件的扫描方式优点是格式完整,文字全对,想用的时候再打开此文件并打印出来即可。但缺点是无法修改其某一部分内容,比如其中一句话想删除,某个标点修改一下位置等。所以我们就可以在软件中选中进行文字识别的相关选项,这样扫描出来的结果不会是个图文件,而是用 Word 等软件可以打开的电子文档,如 " 合同 .rtf " ,原稿中的每个文字和段落都互相独立,且可以分别修改。本文就以在 Windows 操作系统下使用 Photosmart all-in-one 3308 进行 OCR 文字识别为例,介绍了如何使用 " HP 解决方案中心 " 来进行文字识别的方法及注意事项。
若想提高识别率,扫描前该注意些什么 ?
|
注 : |
尤其是对于表格部分过于复杂或包含彩色图像过多的原稿,若圈选过多的彩色图形,会导致软件报内部错误的现象,请一定注意。 |
5.此外,对于表格识别还要求表格内不能包含合并或拆分单元格,如图 1 所示,否则识别效果可能会特别差,甚至识别不出整个表格。

6.一体机随机软件的识别率不会太高,一般在 70 %- 95 % 就已经不错了,表格识别效果可能会更差一些。
为了保证扫描效果,扫描前该设置什么?

3.出现 " 按钮设置 " 窗口,如果您要 OCR 识别文本的话, " 要扫描的内容 " 选择 " 文档 " 选项, " 扫描至 " 您可以选择 "Microsft Word" (如果您有别的文字编辑软件,只要列表里边有的,都可以选择)。如下图:

4.点击右下角 " 扫描文档设置 " 进入可编辑文本设置。在这里我们可以选择识别语言( OCR 语言),由于识别语言只能选择一种,所以原文件最好是单一文字,这样识别效果才好。当我们把文件扫描至 Word 的时候,选择 " 保持页面格式 " 可以大部分地保留原文件的版面,这是默认选项,而选择 " 不保持页面格式 " 的话,原文件的版面格式不被保留(如居中的标题可能会变为居左等等),我们还需要重新修改大量板式。如下图:

设置完成之后,点击 " 确定 " 按钮,回到 "HP 解决方案中心 " 。
文字和表格识别基本操作步骤

2.点击 " 扫描 " 后开始扫描:

3.我们可以用鼠标调整圈住要识别的部分,建议把周围的白边圈在外面这样可以提高识别率,然后点击 " 接受 " , 开始扫描,出现对话框,之后软件会提示 " 是否将另一页扫描到当前的文档中 " 。如果有多页文档需要识别,我们可以将第二页文件放到玻璃板上,点击 " 是 " 。软件会回到预览的界面,请点击 " 新扫描 " 按钮开始第二页的扫描。完成第二页的预览扫描后,可把第二页文件里面要识别的部分圈住,再点击 " 接受 " (此步骤同上)。通过这种方式,就可以把很多页文件里面的内容识别到同一个 Word 文档里面。

4.识别完最后一张后点击 " 否 " ,完成扫描。经过页面处理之后会将识别后的文档以 Word 文档的形式自动打开

5.识别效果图

|
注 : |
由于默认的是把表格识别到 Word 中,所以如果您希望在 Microsoft Excel 软件中编辑表格,通过 Word 软件打开扫描好的表格,全选,拷贝到 Microsoft Excel 就可以了。 |
小技巧:在 Microsoft Excel 软件中编辑识别后的表格
由于默认的是把表格识别到 Word 中,所以如果您希望在 Microsoft Excel 软件中编辑表格,可以看看以下的小技巧:
|
注 : |
如果原文件是表格,也可以按照上面的方法去操作,同样可以识别,只不过默认把识别结果发送到 Word 而不是常用的表格编辑工具 Excel 而已。 |



