plot python 修改属性_Python数据分析之聚合与透视表

962802fd1f5999a1a139e63437f02006.png

◆ ◆ ◆  ◆ ◆

严小样儿原创第N篇~ 读取数据Python用于数据分析好不好,因人而异。但是,excel能做的Python也能做。比如聚合,透视表。我认为更简单一下。如果大家在工作中用得到数据库,用得到Python,可以学习一下数据透视表。第一步:读取数据
import pymysqlimport pandas as pdimport matplotlib.pyplot as plt# 建立连接conn = pymysql.connect('localhost','username','password','database')# 读取SQL为dfsql = 'select * from table'df = pd.read_sql(sql,con=conn)
数据聚合

第二步:数据聚合

# 查看基本属性print(df.index)print(df.columns)print(df.info())# 修改时间格式df['stat_month'] = pd.to_datetime(df['stat_month'],format='%Y%m')# 设置索引df.set_index('stat_month',inplace = True)print(df.head())# 只看一个月份的df_grp1601= df['20160101'].groupby(['brand','areaname'],as_index = False)['profit'].sum()print(df_grp1601)df_grpbrand = df_grp1601.groupby('brand').sum()print(df_grpbrand[df_grpbrand>200000].plot(kind = 'bar'))

ed87b1cd0acc906122afdfe1bb0aac8c.png

数据透视表第三步:数据透视表
pd.pivot_table(df['20160101':'20161201'],values = 'profit',\               index = ['stat_month','brand'],\               columns ='areaname',aggfunc='sum' )
557f28de6d92882fbcdd06e2fe94aa02.png

祝大家早日富可敌国!

记得

在看

—— END ——

663f27d91cc7ab06a1bb796cd5f77981.png

在看”的永远18岁~ 1869507be5036bfe3561efdd648806c0.gif
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值