利用Python实现报告自动生成
前几天,在网上看到一篇介绍利用Python组件实现MS word内容生成的文章。可能是很久没接触编码,感觉在技术领域变得有点孤陋寡闻了,看见一些实用的功能都觉的屌屌的。以前经常通过代码写Excel文件,写Word相对较少,即使有也是基于XML/HTML来实现的。所以,今天我是以一种非专业的态度来分享这个功能,各路Python高手且擅长此类技术的同学请自行忽略。
背景介绍这篇文章来自Chris Moffitt的《Populating MS Word Templates with Python》,文中提到了一个Python开源组件docx-mailmerge,组件的原理是依赖MS Word的mailmerge功能,基于模板式的内容填充,实现动态内容加载和生成。
在安装了docx-mailmerge包并亲自动手尝试后发现,这个包还存在一些缺陷,对于有数值型格式的数据支持不好。为了有一个比较好的演示效果,我将代码进行了简单修改并集成到了tushare里,所以以下的演示将通过tushare来实现。为了表示对作者的尊敬,有兴趣的同学可以直接参阅作者的github:Bouke/docx-mailmerge方法步骤
1、新建模板
打开word(本演示环境是word2013),新建一个docx文件,按照一定的格式假设完成了一个报告。在需要动态加载文字或者数据的地方,可以预留基于word mailmerge功能的域。
2、选择域功能
在需要插入域的地方,点击word工具栏“插入”->"文档部件" -> "域"来设置。
3、设置域代码
在弹出的域值设置对话框里,在“域名”下拉框选择MergeField,在右边域属性输入一个域代码名称。
根据需要可设置各种文字域,也可以设置动态表格域。