OCR:Office也能提取图片中文字
在Microsoft Office 2003中的工具组件中,有一个“Microsoft Office Document Imaging”组件包,可以直接进行光学字符识别(OCR)。在此,笔者介绍一下利用Office 2003中新增的OCR功能从图片中提取字符的方法。
第一步,我们需要安装Microsoft Office Document Imaging的组件,点击开始→程序,在Microsoft Office Tools中点击Microsoft Office Document Imaging安装运行(如图1)。
图1 安装组件
第二步 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的打印屏幕键(PrintScreen)进行屏幕取图。
图1安装组件
第二步:打开有文字的图片或电子书,找到要提取的页面,按下键盘上的PrintScreen键,取屏幕上的图片。
第三步:打开微软Office Word 2003,粘贴刚才的截屏;点击“文件”菜单中的“打印”。安装Microsoft Office Document Imaging组件后,系统会自动安装名为“Microsoft Office Document Imaging Writer”的打印机。如图2,在“打印机”下拉列表框中选择“Microsoft Office Document Imaging Writer”打印机,其他选项无需设置。点击“确定”按钮后,设置文件输出的路径和文件名(默认使用源文件名),很快就可以自动生成一个MDI格式的文档。
图2选择打印机
打开刚刚保存的MDI文件(如图3),根据需要选择文字内容(选中的内容在红框内),然后点击鼠标右键,在弹出的快捷菜单中选择“将文字发送到Word”,这时图片内容就可以自动转换成新的Word文档,然后你就可以随心所欲地编辑了。
图3发送文本到Word
提示:如果不想将转换后的内容输入到新的Word文档中,而是想粘贴到已经打开的Word文档中,只需在上面的操作中点击右键菜单中的“复制”,然后粘贴到指定的文档中即可。
0条评论