今天介绍一下文本数据的提取和转换,这里主要实例的转换为excel文件(.xlsx)转换world文件(.doc/docx),同时需要使用win32api,同pywin32库。
pandas库我之前的博客里面都有详细的介绍和使用,这里主要介绍下win32库。
PyWin32是一个Python库,可以为Python提供Windows扩展。换句话说,它允许您访问各种Windows功能 - 至少Microsoft Office的功能 - 而无需使用Microsoft的一种语言,如Visual Basic或C#。
win32com模块的下载:https://sourceforge.net/projects/pywin32/files/pywin32/(对应你的windows版本)
同时分享Galal Aly’s博主:http://new.galalaly.me/2011/09/use-python-to-parse-microsoft-word-documents-using-pywin32-library/
Pywin32库的一些概念:
1.PyWin32是一个包装器,它使您可以使用Visual Basic for Applications(VBA)中提供的相同方法和属性,但使用Python的语法。
2.这是