数据挖掘笔记之表处理

本文主要探讨了数据挖掘中的表处理技术,包括如何使用pandas创建透视表,设置不同参数如values、index、columns和aggfunc等进行统计分析;介绍了合并表的axis、join、ignore_index等选项,以及如何处理不同连接方式和共同字段;最后讨论了分组聚合,强调了指定分组变量和执行统计操作的重要性。
摘要由CSDN通过智能技术生成

透视表

diamonds.csv
在这里插入图片描述
透视表
在这里插入图片描述
pd.pivot_table(data,values,index,columns,aggfunc,fill_value,margins,dropna,
margins_name)
values:拉入统计项的字段
index:拉入行标签
columns:拉入列标签
aggfunc:统计函数
fill_values:填充缺失值
margins:显示总计值
margins_name:总计值名
在数据可视化中,使用pandas绘图时,使用透视图处理数据。

合并表

pd.concat(objs,axis,join,join_axes,ignore_index,keys)

axis:0行合并,1列合并
join:outer合并所有,inner合并公共
join_axes:保留数据轴
ignore_index:产生新索引
keys:增加索引区分数据部分

pd.merge(left,right,how,on,left_on,right_on,left_index,right_index,sort,su
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值