Python pandas使用pivot_table时由于index存在nan值,导致该行记录未被记录

最新推荐文章于 2024-07-20 00:18:49 发布

永远在减肥永远110的的小潘

最新推荐文章于 2024-07-20 00:18:49 发布

阅读量2.4k

点赞数

分类专栏： pandas python 文章标签： python pandas

本文链接：https://blog.csdn.net/p1306252/article/details/121396401

版权

python 同时被 2 个专栏收录

47 篇文章 12 订阅

订阅专栏

pandas

25 篇文章 11 订阅

订阅专栏

Python pandas 的pivot_table可以实现与Excel透视表类似的效果，但是如果index参数列中存在Nan值，就会导致改行记录不被计入。

result=data.pivot_table(index=["商家名称","月份","活动类型","满减门槛","满减金额"],values=["补贴金额","原价"],aggfunc={"补贴金额":np.sum,"原价":np.sum}).reset_index()#因满减门槛及满减金额存在Nan值，导致pivot_table的结果并不准确

目前我是采用以下两种方式避免这种问题：
法一：用空字符串替换Nan值

data.loc[data["满减门槛"].isna(),"满减门槛"]=""
data.loc[data["满减金额"].isna(),"满减金额"]=""

法二：使用fillna()替换Nan值

df["满减门槛"].fillna(0,inplace=True)
df["满减金额"].fillna(0,inplace=True)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

永远在减肥永远110的的小潘

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

记录一下最近在使用pd.pivot_table时遇到的坑：pivot_table的index参数中的列，如果存在nan值，该行记录将会被不计算

weixin_43315203的博客

03-10

3102

如题。最近在做个简易的统计脚本，思路大致描述一下：用到的工具： mysql， selenium.webdriver pymysql，sqlalchemy，pandas，numpy mysql的建库建表部份就直接省略了： 1，毕竟与这个主题是弱关系； 2，大部份的问题都能直接从百度上，甚至直接在CSDN网站里检索到； 3，关于mysql报错还是提一嘴吧，执行sql语句报错时候会有个报错数字号码（一般为4位数），可以直接按照关键词格式“数据库软件名（空格）报错数字号码”，在搜索引擎（如百度，谷歌，CSDN的

记录下pandas的pivot_table（）制作数据透视表遇到的几个坑

m0_55863676的博客

01-10

2618

1、如果索引中有空置，pandas不会计算该条数据，并忽视该条数据，因此可能导致数据缺失、个人解决方法： for k in indexTable: rightTable[k].fillna('这是空值',inplace=True) 用循环填充索引的空值 2、pivot_table(index='行标签',values='求和项',aggfunc=np.sum) 求和项标签报错'Series' object has no attribute 'columns' 个人解决方案： Ta

参与评论您还未登录，请先登录后发表或查看评论

Pytho 笔记：Pandas函数pivot_table和groupby默认删除含有空值的行

htuhxf的博客

03-15

6109

这是一个早在2013年就被发现的一个小问题：即pandas.pivot_table()的index里边含有空值的，空值的对应透视数据会被忽略。使用pd.fillna() import pandas import numpy a = [['a', 'b', 12, 12, 12], ['a', numpy.nan, 12.3, 233., 12], ['b', 'a', 123.23, 123,...

Pandas——NaN&Pivot&dropna&reset_index

I'm zm

04-21

3057

本文的数据是Titanic上的船客的信息，有这么几个属性： pclass – the cabin class of the passenger. 1 was the best cabin class, followed by 2, then 3. name – the name of the passenger. sex – the gender of the passeng

python打印为nan变量的数量_Python Pandas-构造多元数据透视表以显示NaN和非NaN的计数...

weixin_39612038的博客

12-17

199

我有一个基于不同气象站的数据集,其中包含多个变量(温度,压力等),stationID | Time | Temperature | Pressure |...----------+------+-------------+----------+123 | 1 | 30 | 1010.5 |123 | 2 | 31 | 1...

python中pivot函数用法_如何使用Pivot函数重塑此数据帧？

weixin_32631179的博客

01-29

684

我使用包含以下信息的movies数据集：df.head(10)color director_name num_critic_for_reviews duration director_facebook_likes actor_3_facebook_likes actor_2_name actor_1_facebook_likes gross genres ... n...

全栈式数据分析:Pandas pivot_table去掉nan

阿桂天山的技术栈

05-16

253

如果用.fillna('无')代替nan后,想要使数据显示为千分位且保留两位小数的功能就会报错,所以最好还是用.fillna(0)比较好。话不多说,有图有源码。

Python系列之 Pandas库

唐僧骑马噔了个噔

01-15

858

Python Pandas库学习Pandas库Pandas数据结构Series创建Series对象Series索引和切片选择数据Series name属性和rename方法DataFrame创建DataFrame对象提取添加删除列索引/选择赋值运算合并连接追加combine_first()函数分组 Grouping可视化数据输入与输出Pandas基础用法Head与Tailshape.array和to_numpy()方法缺失值操作删除缺失值填充缺失值fill_value方法fillna方法提取缺失值

python numpy pandas 题目_Python中 Pandas 50题冲关

weixin_35288487的博客

02-09

1374

参考资料 | 100-pandas-puzzles - GitHub | Pandas 百题大冲关基本操作导入 Pandas 库并简写为 pd，并输出版本号import pandas as pdpd.__version__从列表创建 Seriesarr = [0, 1, 2, 3, 4]df = pd.Series(arr) # 如果不指定索引，则默认从 0 开始df从字典创建 Seriesd =...

Pandas实现DataFrame按行求百分数(比例数)

09-18

此外，如果数据中存在缺失值（NaN），`div`方法会自动处理这些情况，不会影响计算结果的正确性。总结来说，Pandas提供了一种直观且高效的方式，让我们可以轻松地计算DataFrame中每一行的百分比。通过`div`和`sum`...

【Python常用模块】_Pandas模块3-DataFrame对象

weixin_50296259的博客

06-07

104

使用列表/元组创建(外层列表/元组内的每一个元素为一行)# 列表(元组)嵌套列表(元组)# 行标签和列标签均为默认# 列表(元组)嵌套字典# 行标签为默认，列标签使用字典的key使用字典创建(字典里的每一对key-value为一列)# 字典的values为列表(元组)# 行标签为默认，列标签使用字典的key# 可以在创建DataFrame对象的时候，通过index参数自定义行标签# 字典的values为Series对象。

python中table表结构_python 获取mysql 库信息/表信息/表结构/索引

weixin_39983383的博客

12-11

436

python 获取mysql 库信息/表信息/表结构/索引核心代码import pymysqlclass SQLgo(object):def __init__(self, ip=None, user=None, password=None, db=None, port=None):self.ip = ipself.user = userself.password = passwordself.db...

Python中index的用法详解

最新发布

Python老吕的博客

07-20

4404

在Python的编程世界里，index是一个相当实用的工具，特别是在处理列表（list）和字符串（string）时。这个方法的主要作用就是帮助我们快速找到某个元素或子字符串在列表或字符串中首次出现的索引位置。想象一下，如果你有一本字典，index方法就是帮助你找到某个单词首次出现页码的那只手指。如果元素或子字符串不存在，index方法会像找不到单词的字典一样，抛出一个ValueError异常。index方法是Python中用于查找列表元素或字符串子串首次出现位置的有力工具。

pandas使用pivot_table函数构建透视表：index参数指定聚合的行索引列表（形成复合行索引、改变列表顺序则索引水平跟随变动）、values参数指定需要进行聚合的数值数据列

statistics+insight+vista+power

11-24

674

pandas使用pivot_table函数构建透视表：index参数指定聚合的行索引列表（形成复合行索引、改变列表顺序则索引水平跟随变动）、values参数指定需要进行聚合的数值数据列、aggfunc参数指定聚合函数

python2和python3 pivot_table方法的参数：rows和index

jiaochongjia的博客

07-10

650

在python2中，pivot_table 方法的 rows 参数在python3中已经弃用了，改成了 index: In [275]: tips.pivot_table(index=['sex', 'smoker']) Out[275]: size tip tip_pct total_bill sex smoker Female No 2.59259

pandas pivot_table之数值精度丢失陷阱

S_o_l_o_n的博客

11-07

1033

pandas的pivot_table函数可以指定行列值重新制表，并且对于同一行列索引下的多个值会进行聚合运算，默认是均值运算，因此，这里如果我们默认其aggfunc的均值运算，那么会存在将其他数值类型转为浮点值的行为，如果原本是数值较大的整型，超出了64位浮点数能精确表示的最大范围的话，这里就会存在精度丢失现象。尽管我们可以让aggfunc=lambda x:x，即不对value做任何操作，这样不会存在均值计算，但是实际上还会存在精度丢失的情况。看如下是pivot_tab...

Pandas pivot - ValueError: Index contains duplicate entries, cannot reshape

m0_38093796的博客

10-23

2726

pandas pivot()

Tables Tutorial

思考的智慧，知识源于思考

03-18

500

Tables are the only "container" type in Lua. They are associative arrays ([1]), which means they store a set of key/value pairs. In a Key/Value pair you can store a value under a key and then later

pandas使用教程：数据透视表函数 pivot_table

Cachel Wood的博客

07-10

595

注意此时的aggfunc参数，当参数值包含列表时，在结果DataFrame中就会显示函数名称。如果需要添加合计列，只需指定margins=True即可，同时根据需要指定合计名称。当然与groupby类似，对于计算函数我们可以同时指定多种方式。可以实现同样的效果。

pivot_table函数index忽略空值

05-27

可以使用`pivot_table`函数中的`dropna`参数来忽略空值。具体来说，可以将`dropna`参数设置为`True`，这样在生成透视表时会自动忽略掉所有包含空值的行或列，对应的索引也会被忽略。例如，如果要对数据集`df`进行透视，以`category`列为行索引，`year`列为列索引，`value`列为值，并忽略所有空值，可以使用如下代码： ``` import pandas as pd df = pd.read_csv('data.csv') table = pd.pivot_table(df, values='value', index='category', columns='year', aggfunc='mean', dropna=True) ``` 这样生成的透视表`table`中，所有包含空值的行或列都会被自动忽略掉。