pypandoc库实现文档转换
写在前面:
对于python程序员来说,文件格式之间转换很常用,尤其是把我们爬虫爬到的内容转换成想要的文档格式时。这几天看到一个网站上有许多文章,个人很喜欢,直接复制太麻烦,为了将爬到的html文件以word .doc 文件的格式存储到自己的数据库,选用了pypandoc库。
这个库语法简单,瞄一眼就能会,就跟我一起来看看吧。
安装
安装一般先装pandoc 然后安装pypandoc库
1.window
1>安装pandoc:直接下载windows版本的.msi文件即可,传送门 https://github.com/jgm/pandoc/releases/
2>安装pypandoc库:命令行安装,或者直接idea安装
1 |
|
2.ubuntu
1 2 |