Python中使用pandas中concat横向连接表时产生NaN

最新推荐文章于 2024-01-11 17:41:12 发布

星星学园

最新推荐文章于 2024-01-11 17:41:12 发布

阅读量3.7k

点赞数 7

分类专栏：数据分析学习文章标签： python 数据分析开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhihuiyu123/article/details/122490169

版权

数据分析学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在跟着一些教程学习数据分析时，会用到pandas操作。其中遇到了一个小问题：

使用concat横向连接(axis=1)两个表时，如果其中一张表格中做过drop的操作，而另一张没有做过，连接之后，会产生很多NaN的行。

本文适用情况：

数据处理时已经完成了缺失值处理，比如删除了某些行。在进行后续的操作时，如对某一列编码产生了新的列，需要重新拼接时，如果用concat函数的默认参数，会导致被删除的行以NaN值填充重新出现（如下图）。然后需要重新处理缺失值。。

先说结论：

如果两个表格最开始行数相同：将concat函数的join='inner'。默认为'outer'，导致的上述问题发生。

如果行数不同，

简单整理了一下pandas的concat()函数用法。

1、首先简单创建两个DataFrame，分别为df1、df2：

2、横向连接axis=1（纵向连接时axis=0即可），df2连接到了df1的右侧。

3、接下来对df1进行第0行的drop操作：可以看到index从1开始，第0行已经被删除掉。

4、此刻如果直接执行concat([df1_1,df2],axis=1)，会发现0,0位置产生了一个NaN，相当于在拼接时填补了之前删除的df1的index=0的行。

查看了一下pandas文档中关于concat的介绍：发现concat()默认的join方式为'outer'。

pandas.concat — pandas 1.3.5 documentationhttps://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html

改为inner再看一下效果：第0行没有出现了。是我想要的效果。

重新在课程的代码里面用join='inner'试一下，NaN不会出现。但是由于后面的表的行数=前表删除行之后的行数，内连接之后行数变少了。最好的办法，是用前表的index列表作为后表创建的index。

关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

星星学园 CSDN认证博客专家 CSDN认证企业博客

码龄9年

62: 原创

4万+: 周排名

51万+: 总排名

56万+: 访问

: 等级

4236: 积分

374: 粉丝

339: 获赞

63: 评论

1547: 收藏

私信

关注

热门文章

分类专栏

最新评论

DMRS和SRS的不同
蛋黄骑士酱: 有个疑问 dmrs为什么都说是上行参考信号呢 nr中dmrs也用在pdsch中呢
安装pygraphviz库的波折历经
CSDN-Ada助手: 非常感谢CSDN博主的分享，你的博客《安装pygraphviz库的波折历经》让我们学到了很多。我觉得你可以继续写一篇博客，分享如何在Python中使用graphviz库进行可视化。这样的技术文章对其他用户学习数据可视化非常有帮助。相信会有更多读者关注你的博客。期待你的下一篇文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
说说最小均方误差（MMSE）
孤独*娱乐: 信道故计
安装pygraphviz库的波折历经
2301_76887833: conda一直retry怎么回事
自相关的物理意义
GalaxyerKw: 确实，一语中的。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。