cannot index with vector containing NA / NaN values

最新推荐文章于 2024-08-21 14:31:38 发布

Danker01

最新推荐文章于 2024-08-21 14:31:38 发布

阅读量1.1w

点赞数 1

分类专栏：数据分析

本文链接：https://blog.csdn.net/weixin_42575020/article/details/95336791

版权

数据分析专栏收录该内容

38 篇文章 23 订阅

订阅专栏

关于这个小问题，其实是pandas使用中经常出现的问题。具体原因就是在dataframe里面nan是一个特殊的存在，因为你的数据里包含nan或者inf类型的数据类型，所以你在对这一数据进行处理时，就会出现标题上出现的错误。

怎么解决呢？

方法也是有很多的，这里举一个简单的方法，但是绝对不是最科学的方法，

df['近期销量']=df['近期销量'].replace(np.nan,'0').astype(int)
df=df.sort_values(by='近期销量',ascending=False)

这里是用字符串形式的0将nan给替换了，当然你也可以用pandas里面的fiina（）函数进行处理，但是要注意处理的范围，因为数据里的维度比较多，很可能将所有的nan都处理掉了。

df[['城市','省份']]=df[['城市','省份']].fillna('暂无')

总结：在进行数据处理之前，要对数据内容进行预处理，预处理是就要对数据的异常值进行处理，这是要保证数据的质量问题，也是保证数据分析结果的科学性。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Danker01

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Debezium报错处理系列十二：Cannot enlarge string buffer containing 1073740820 bytes by 1704 more bytes.

zhengzaifeidelushang的博客

11-13

1415

Debezium报错：Cannot enlarge string buffer containing 1073740820 bytes by 1704 more bytes.\n 在位置：slot “debezium”, output plugin "wal2json 错误原因： Postgresql逻辑复制使用wal2json时，会将一次事物提交的所有数据转化为一条json，例如删除大量数据，一次提交大量数据解决方法如下：在不改动Postgresql数据库使用的wal2json插件情况下，推荐

成功解决ValueError: You are trying to load a weight file containing 4 layers into a model with 0 layers.

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

07-29

1万+

成功解决ValueError: You are trying to load a weight file containing 4 layers into a model with 0 layers. 目录解决问题解决思路解决方法解决问题 ValueError: You are trying to load a weight file ...

参与评论您还未登录，请先登录后发表或查看评论

【解决str.contains()问题】ValueError: cannot index with vector containing NA / NaN values

qq_33731081的博客

01-05

6254

问题描述; 当使用dataframe执行如下操作： df[df.line.str.contains('G')] 目的是：找出df中line列中包含字符’G’的所有行时，出现如下问题： --------------------------------------------------------------------------- ValueError ...

hibernate 适配gbase8s 在使用boolean 时报错could not execute query

wangyx01的博客

08-21

437

查看生成的sql发现将boolean 类型 true 替换成了1 即 where c1=true 解析成了 c1=1。跟踪代码发现在语法解析类SqlGeneratorBase进行了替换动作。具体原因为在hibernate 方言中默认转换规则如下。解决方案，在具体方言实现中重写此方法。

pandas里面过滤列出现ValueError: cannot index with vector containing NA / NaN values错误的解决方法(转)

kodmoqn的博客

10-05

715

pandas里面过滤列出现ValueError: cannot index with vector containing NA / NaN values错误的解决方法(转)

【Python】（pandas错误）：ValueError: Cannot index with multidimensional key

YYIverson的博客

08-25

1万+

问题出现情景：读取DataFrame中某一行，并进行value_counts()。 print(df['Layout'].value_counts()) 打印出来的如下 2室1厅 9485 3室1厅 3999 3室2厅 2765 1室1厅 2681 2室2厅 1671 4室2厅 930 1室0厅 499 4室1...

Pandas多级索引数据处理及fillna()填充方式

Java/Python大数据成长之路

10-26

2226

函数可用于将Pandas数据帧（DataFrame）中的缺失值（NaN）用指定的值或方式进行填充。接下来，我们将以一个小实验的方式来具体说明fillna()填充方式如何使用，并且，在多级列索引的情况下如何使用。说明：fillna()的method参数和直接使用ffill()、bfill()效果一样，将来会被遗弃。将数据转换为三列：第一层列索引为一列，第二层列索引为一列，数据项为一列，最终结果数据（NaN）不能丢失。指定列向下填充（其它类似1.2）对整个df按列向下填充。对整个df按列向上填充。

pandas利用str.contains筛选报错

natsumela的博客

10-12

2007

在使用pandas对excel进行筛选时， df.loc[df['threat_type'].str.contains("DGA")] 出现以下报错： ValueError: Cannot mask with non-boolean array containing NA / NaN values 报的是分组这一列中，包含了非字符串的内容，由于.str.contains的使用要求该字段必须为字符串，不能有数字等，故而在代码上加上 df.loc[df['threat_type'].str.conta

hive更换tez引擎报错Expected authority at index 7: file://

qq_44724453的博客

03-23

2230

首先查看hive-env.sh是否是下面形式 # Set HADOOP_HOME to point to a specific hadoop install directory export HADOOP_HOME=/opt/SoftWare/Hadoop/hadoop-3.1.3 export HIVE_CONF_DIR=/opt/SoftWare/Hive/hive-3.1.2/conf # Folder containing extra libraries required for hive c

TypeError: Struct containing a (nested) mapping cannot be constructed.

weixin_51914472的博客

12-24

2174

TypeError: Types in storage containing ‘nested’ mappings cannot be assigned to.TypeError: Struct containing a ‘nested’ mapping cannot be constructed.

从Python pandas.DataFrame数据表中提取或删除包含指定字符串的行

weixin_55674264的博客

01-14

9650

有时候需要删除数据表中某一列中包含指定字符串的行，可以使用pandas的字符串包含函数.str.contains： pd.Series.str.contains(pat, case=True, flags=0, na=None, regex=True) #pat是搜索字符，case表示是否区分大小写，flags表示是否传递给 re 模块的标志，regex=True则pat是一个正则表达式，regex=False表示pat是一个字符串官网详细解释链接：https://pandas.pydata.org/d

pandas筛选数据时可能会遇到的报错

明顯有閒

07-12

1万+

df[df['director'].str.contains('|')] ## output ValueError: cannot index with vector containing NA / NaN values ## 仔细查看数据 df.director.str.contains('|').unique() ## output array([True, nan], dtype=obj...

Pandas通过某列不是NaN来进行筛选