昨天接到一个任务要将pdf中的表格转成excel,打开一看pdf有一百多页,看来手打是不可能了,只能想办法处理。
由于我拿到的PDF是这样的,第一步先把PDF转成word形式,我这里使用的是Adobe Acrobat,也可以使用wps等软件,转换完后效果如下:
发现还有个小问题,就是每页都有个大水印,这个水印由于是从pdf中转换来的,不是word里添加的,所以在word中关闭水印并不能处理这个问题。
双击水印发现其实是艺术字,学习网上方法采用VBA编写宏批量删除艺术字,代码如下:
Sub 删除艺术字()
Dim sh As Shape
For Each sh In ActiveDocument.Shapes
If sh.Type = msoTextEffect Then
sh.Delete
End If
Next
End Sub
具体使用方法是点击视图-宏,然后在弹出的窗口中点创建,点完就会弹出VBA的编辑器,将代码粘进去即可,使用宏的时候在刚才点创建的窗口点执行即可。
艺术字就顺利删除了(ps:可能会有个别骨骼惊奇的艺术字没被删掉,多执行