df.loc[df[].index,] df.loc[,] 关于df.loc[] 的问题。df.loc 容易出现的错误下标筛选问题

babyjustsaidyes

已于 2022-03-21 18:48:29 修改

阅读量1.5k

点赞数 1

分类专栏： Pandas 文章标签： python

于 2022-03-21 18:46:42 首次发布

本文链接：https://blog.csdn.net/weixin_43256057/article/details/123642805

版权

Pandas 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

qq.loc[qq[(qq.period_week>=0108) | (qq.member_no.isin(pc.member_no))].index,'code'] = 4566
qq.loc[(qq.period_week>=0108) | (qq.member_no.isin(pc.member_no)),'code'] = 4566

这2者看似计算逻辑一样，但其实有区别的，比如：
member_no period_week
1 ZA28210818777 0108
1 UM51210819108 0100

#下面只有第一行符合条件，用第二种写法就只会选中第一行来改变
member_no period_week code
1 ZA28210818777 0108 4566
1 UM51210819108 0100 NaN

但第一种写法是选中第一行的index，由于第二行的index也是1，所以就把2行都选中并改变code==4566，这显然非我本意。
member_no period_week code
1 ZA28210818777 0108 4566
1 UM51210819108 0100 4566

所以第一种写法必须建立在df.index 不重复的基础上，否则它就会把不符合筛选条件但index重复的数组也选中了！！

建议用第二种写法，稳妥一点。

qq.loc[(qq.period_week>=0108) | (qq.member_no.isin(pc.member_no)),'code'] = 4566

babyjustsaidyes

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
df.loc[df[].index,] df.loc[,] 关于df.loc[] 的问题。df.loc 容易出现的错误下标筛选问题

易错细节问题
复制链接

扫一扫

专栏目录

df.loc[df[].index,] df.loc[,] 关于df.loc[] 的问题。df.loc 容易出现的错误 下标筛选问题

所以第一种写法必须建立在df.index 不重复的基础上，否则它就会把不符合筛选条件但index重复的数组也选中了！！

“相关推荐”对你有帮助么？

df.loc[df[].index,] df.loc[,] 关于df.loc[] 的问题。df.loc 容易出现的错误下标筛选问题