| 1.pdf转换为word文档的必要性: 1.1需要将pdf文档中的内容进行编辑 1.2需要从pdf文档中获取部分内容 2.pdf文档整篇转换为word并进行编辑的方法 2.1文字文档创建的PDF转换Word的方法: 2.1.1文字文档创建的PDF:PDF文件中的文字是以计算机字符代码的形式被包裹在文件中。文字非常清晰锐利。 2.1.2利用软件 2.1.2.1 SolidConverterPDF:目前我使用过的最好的该类软件。http://www.downxia.com/downinfo/867.html 2.1.2.2 Adobe Acrobat Pro打开PDF文件后:“文件”另存为(注不是Reader,以下以中文版7.01为蓝本进行解释http://www.i8shop.com/main/net/softdownload/softDownload.htm) 2.2.扫描文档(图片文件)创建的PDF转换Word的方法: 2.2.1扫描文档(JPEG)创建的PDF,PDF文件中的文字是一个页面图像中的像素组成的线条,没有字符代码信息。 2.2.2.软件:Adobe Acrobat Pro 2.2.3方法 2.2.3.1识别软件(汉王文本王http://jyw.99365.net/downinfo/87.html)进行文字识别 2.2.3.1.1pdf→图片格式文件(Jpeg) 用Adobe Acrobat Pro打开该PDF文档 点击“文件”—“另存为” 在弹出窗口中保存类型选取“Jpeg” 2.2.3.1.2 文字识别 打开OCR程序,打开刚保存的Jpeg文档 点击“版面分析” 点击“文字识别” 可在编辑窗口中对照原文进行更正编辑 2.2.3.1.3 点击“插入Word文档”转到Word中,进行稍微的排版 2.2.3.2 Office 2003中自带的Microsoft Office Document Imaging转换 2.2.3.2.1首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 提示:如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件 2.2.3.2.2运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。 3.从pdf文档中截取部分内容到word文档 3.1截取文字 3.1.1 截取文字文档创建的PDF中的文字:利用Adobe Acrobat Pro的选择和快照工具按钮进行相关操作就行了。 3.1.2截取扫描文档创建的PDF中的文字: 3.1.2.1利用Adobe Acrobat Pro的选择和快照工具按钮选择截取的文字界面,新建一个图片文件,再用文字识别软件进行文字识别。 3.1.2.2使用抓图软件获取所需PDF文档的画面,再用文字识别软件进行文字识别。 3.2截取图片:利用Adobe Acrobat Pro的选择和快照工具按钮进行相关操作就行了。 3.3需要注意的是: 有的PDF文档由于制作的时候设置了某些安全选项,禁止我们拷贝其内容。如果要了解这方面的设置,可以通过选择:“文档”-“安全性”-“显示本文档的安全性设置”查看。如果其中的“内容复制或提取”一项被设置为No,这时上述拷贝文字和图像方法就不起作用了。此时,惟一的权宜之计就是使用抓图软件获取某些PDF文档的画面,再进行文字识别。 声明:有关软件下载连接是临时搜索出来的,不能保证安全性及可用性,只是为了网友方便,不放心的话请自行上网搜索。我的软件也是这个办法得来的,但是已经不记得在哪里下的了。 |