使用pypandoc将文本md格式转化为docx格式
一、目标
将md、txt等格式转化为docx格式,可以进行单个文件转换,也可以进行批量转换。
二、软件
(一)vscode
(二)python
1.pypandoc
(三)pandoc
需要在windows下安装,即是只使用python也要安装,因为pypandoc模块要调用win下的pandoc
三、实例
(一)在终端命令模式下单个转换
# pandoc 需要转换的文件名.md -o 转换后的文件名.docx --reference-doc=模板文件名.docx
# -o 输出
# reference-doc 引用的模板
pandoc README.md -o read.docx --reference-doc=filemodel.docx
(二)使用python程序转换
import pypandoc
def md2docx(in_file_name,out_file_name='sample_out.docx',in_file_path='',out_file_path=''):
# pypandoc的版本号,只是用于测试,生产环境可以不用
pypandoc_version = pypandoc.get_pandoc_version()
print(pypandoc_version)
# 转换后的文件名
out_file_name = in_file_name[0:-3]+'.docx'
# 引用的模板名,如没有要将参数extra_args删除
filemodelnonumber = r"filemodelnonumber.docx"
out_file = pypandoc.convert_file(in_file_name,# 需要转换的文件
outputfile=out_file_name,# 转换后的文件
format='md',# 转换前的格式
to='docx',# 转换后的格式
extra_args=['--reference-doc='+filemodelnonumber] #转换时引用的模板
)