上次在用python中的pandas库进行透视表之后,因为索引和列名都存在多重索引的问题,这个问题作为了遗留问题。
df2.sum(axis=0),这个结果页好玩,对每个字段都求和,依稀觉得和上面的没啥区别了。
import pandas as pd
import numpy as np
df=pd.read_csv(r'E:\工作计划\周例会数据分享\2020.6.19\1元版活激活数据.csv',sep=',')df2=pd.read_csv(r'E:\工作计划\周例会数据分享\2020.6.19\组织及活动对应单日新增用户.csv',sep=',')df2.sum()有点意思,结果截图如下:![99b1120b5acc7db017285f168e969770.png](https://i-blog.csdnimg.cn/blog_migrate/98ed814b1356f16a0bb014cd9785a7f5.png)
对用户数进行求和:sum(df2['用户数'])
查看各字段的属性:df2.dtypes
查看数据集的属性:type(df2)
新增一列将文本格式转为日期格式:df2['date']=pd.to_datetime(df2['商户注册时间'])
将日期中的年月进行提取并新增字段:df2['year']=df2.date.dt.year,df2['month']=df2.date.dt.month
将透视表的多重索引进行重新设置:dfzz=df3.reset_index(level=None,drop=False,inplace=False,col_level=0,col_fill='')
将多重列名仅取首行值进行重命名:df3.columns=df3.columns.get_level_values(0)
重命名列名:dfzz.columns=['activity_type_no','盛POS用户','超级盛POS用户']
今日偶得:在不停的实践中,才能记住知识点并解决问题。