python自动生成分析报告_利用python生成pptx分析报告的工具包:reportgen!太吊了!...

129938968_1_20180411113644144

129938968_2_20180411113644347

2、通用数据的分析

在这个分析报告中,我会对DataFrame数据的每一个字段进行分析,判断它们的类型,然后画出合适的图表。对于因子变量,自动绘制柱状图或条形图;对于数值型变量,自动绘制出拟合的分布图;对于一般的文本,自动绘制词云。同时也会给出一个统计表格,内含各个变量的场景统计数据,如最大值、最小值、均值、标准差、唯一数个数、缺失率等。下面是一个例子,代码和数据可在我的github中寻找。

129938968_3_20180411113644597

它会生成如下 pptx 文件

129938968_4_20180411113644753

129938968_5_2018041111364550

另外这里有一些过程函数也推荐给大家

特征统计分析

129938968_6_20180411113645191

数据预处理

129938968_7_20180411113645316

信息论相关度量函数

129938968_8_20180411113647269

机器学习模型辅助建模函数

129938968_9_20180411113647425

3、问卷型数据分析

问卷数据涉及到各种题型,包括单选题、多选题、填空题、矩阵多选题、排序题等等。不管是

频数统计还是交叉分析,单选题都很好处理, 但其他题目就相对复杂的多,比如单选题和多选题

之间的交叉统计,多选题和多选题之间的交叉统计等。

为了能使用统一的函数进行常规分析,本工具包使用专门针对问卷设计的数据类型(或者说编码方式)。在这种类型中,每一份问卷都有两个文件,data 和 code ,它们的含义如下:

1).data:按选项序号编码的数据(csv、xlsx等都可以)。具体的示例如下:

Q1Q2Q3_A1Q3_A2Q3_A3Q3_A4111010

120010

111001

230110

121010

140101

221010

110101

221010

其中 Q1、Q2是单选题,在Q1中,1代表男,2代表女。Q3是多选题,一共有四个选项,分别代表 Q3_A1:'旅游',Q3_A2:'健身',Q3_A3:'艺术',Q3_A4:'养生'. 多选题常用这种01矩阵存储。

129938968_10_20180411113647550

129938968_11_20180411113647769

129938968_12_2018041111364866

129938968_13_20180411113648300

129938968_14_20180411113648535

129938968_15_20180411113648832

129938968_16_2018041111364997

Report 是一个类,可以打开 pptx文件从中获取信息并新建 slide.

首先是初始化,

import reportgen as rpt# 导入分析报告prs=rpt.Report()#prs = rpt.Report(filename='分析报告.pptx')

函数默认会打开reportgen自带的模板文件(路径是~\reportgen\template\template.pptx), 大家也可以自己指定其他文件。

对于存在内容的 pptx,Report能轻松实现获取所有的文本和图片

#获取分析报告中所有的文本prs.get_texts()#获取分析报告中所有的图片prs.get_images()

同时你也能很简单的创建一页新的 slide

data=pd.DataFrame(np.random.randint(100,1000,size=(3,4)),index=['品牌A','品牌B','品牌C'],columns=['Q1','Q2','Q3','Q4'])slide_data={'data':data,'slide_type':'chart','type':'COLUMN_CLUSTERED'}prs.add_slide(data=slide_data,title='品牌销量',summary='品牌销量',footnote='')

在上面的脚本中,我们添加了一张各品牌的销量分布图,图表类型是柱状图。

129938968_17_20180411113649222

129938968_18_20180411113649457

谢谢阅读!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值