基于透视表自动化Pandas使用 (一)DataFrame 基本模块

data = pd.read_excel(r'path', sheetname=0, header=0)#读取path路径文档第一个sheet表,header=0 首行为列名
dk_origin = pd.DataFrame(data, columns = ['A','B','C','D'']) #只保留源数据表的A,B,C,D列
dk = dk_origin[dk_origin['A'].isin(['A1','A2','A3','A4'])] #筛选A列值为A1,A2,A3,A4的行

dk_countbybrand = dk.groupby('A')['B'].count()#基于A列值进行分类,并对各类B列的值进行计数
dk_guestbybrand = dk.groupby('A')['C'].nunique()#基于A列值进行分类,并对各类B列的值进行非重复计数(重复项只计首次出现)
#groupby函数输出的值格式为series,将其分别存储在相应变量内

dk_1 = {'A':dk_countbybrand, 'B':dk_storebybrand}#将groupby的值存为字典格式,A,B是列名
dk_result_brand = pd.DataFrame(dk_1)#将字典转化为pd.dataframe格式

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值