最近在做新会员,老会员,离返会员的建模分析,在使用pandas中遇到很多问题
1、关于pandas中update的报错cannot reindex from a duplicate axis
这个问题显示你的dataframe的行索引有重复,重新索引编码即可。
我的问题是因为我将两个数据框concat后,索引有重复的。
网上有很多解释,但是只有重新编码行索引才解决了我的问题
df.index=[ ],即可
2、df.loc[df[‘年龄’]==[12,34,56,13,45],:]
这种筛选的方法是错误的,应该df.loc[df[‘年龄’].isin[12,34,56,13,45],:]
取反则应该df.loc[~df[‘年龄’].isin[12,34,56,13,45],:]
具体参考https://blog.csdn.net/sigtem/article/details/81735242
3、交集,并集、差集
注意集合才有这些方法
再需要在pandas中进行后续筛选时,转化为list即可
Python每日一记38>>>pandas相关小问题
最新推荐文章于 2024-06-05 11:11:41 发布