记录一下最近在使用pd.pivot_table时遇到的坑:pivot_table的index参数中的列,如果存在nan值,该行记录将会被不计算

本文记录在使用pandas的pivot_table时遇到的问题:当index参数包含有NaN值的列时,相关行会被排除。解决方案是先使用fillna填充缺失值,确保所有记录在pivot_table过程中被正确计算。
摘要由CSDN通过智能技术生成

如题。
最近在做个简易的统计脚本,思路大致描述一下:

用到的工具:
mysql,
selenium.webdriver
pymysql,sqlalchemy,pandas,numpy

mysql的建库建表部份就直接省略了:
1,毕竟与这个主题是弱关系;
2,大部份的问题都能直接从百度上,甚至直接在CSDN网站里检索到;
3,关于mysql报错还是提一嘴吧,执行sql语句报错时候会有个报错数字号码(一般为4位数),可以直接按照关键词格式“数据库软件名(空格)报错数字号码”,在搜索引擎(如百度,谷歌,CSDN的检索栏等等)检索报错的原因,再根据查询到的报错原因修改sql语句就可以了。

思路正文:
首先自然是从销售平台下载账单,将会获取到一个CSV文件。
然后就可以用csv_table=pd.read_csv进行读取了。

由于账单文件中,存在
f“一个订单中的同一种货物,如果客人购买的个数超过1个,也会分成 {购买个数} 行”
的情况,所以在导入到mysql前,需要做一次pivot_table,尽量将同一订单中的同一货物,归到同一行记录中。

接着就是去除与数据库中记录重复的记录这一项工作:
从上一个步骤中获取到的table对象中,提取日期范围,
再通过db_table=pd.read_sql,结合sql语句,从数据库中请求到在日期范围内的所有记录,

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值