python 导入数据对不齐_将Pandas DataFrame的参差不齐的行移动到使用部分字符串搜索清理数据...

最新推荐文章于 2023-03-16 11:12:23 发布

李清予

最新推荐文章于 2023-03-16 11:12:23 发布

阅读量367

点赞数

文章标签： python 导入数据对不齐

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42358173/article/details/113495538

版权

这篇博客讨论了在Python中使用Pandas处理CSV数据时遇到的列不对齐问题。作者分享了如何通过创建新列合并特定列的值，特别是针对以'KT'结尾的数据。同时，文章提到了尝试使用条件筛选和iloc操作，但寻求更高效的方法来格式化和合并这些数据。

摘要由CSDN通过智能技术生成

从.csv文件导入数据后，我有一些类似的数据(尽管顺序是数百列和数千行)：4 5 6 7 8 9 10 11 12 13 14 15 16

0 302255Z 09005KT 1 1/4SM BR CLR M00/M00 A3044 RMK AO2A SLP311 T10021002 $;

1 302232Z 08003KT 1 1/4 BR CLR M00/M00 A3044 RMK AO2A SLP310 $; NaN

2 302225Z 09005KT 1 1/2SM BR CLR M00/M00 A3044 RMK AO2A SLP309 $; NaN

3 302155Z 08003KT 2 1/2SM BR CLR M00/M00 A3043 RMK AO2A SLP306 T10001000 $;

4 302055Z 09004KT 3SM BR CLR 00/00 A3042 RMK AO2A SLP304 T00020002 56001 $;

5 301955Z 00000KT 3SM BR CLR 01/01 A3042 RMK AO2A SLP304 T00080008 $; NaN

6 301855Z 09006KT 3SM BR FEW055 01/01 A3042 RMK AO2A SLP303 T00110011 $; NaN

7 301655Z 10004KT 2 1/2SM BR FEW050 M00/M00 A3041 RMK AO2A SLP301 T10031003 $;

8 301610Z 09004KT 2 1/2SM BR CLR 00/00 A3041 RMK AO2A SLP301 $; NaN

9 301555Z AUTO 08005KT 4800 BR CLR 01/01 A3041 RMK AO2 SLP300 T00070007 $;

10 301509Z AUTO 06003KT 4800 BR CLR 01/01 A3041 RMK AO2 SLP300 $; NaN

11 301449Z AUTO 10003KT 4000 BR CLR 01/01 A3041 RMK AO2 SLP300 $; NaN

12 301355Z AUTO 07004KT 6000 BR CLR 02/02 A3041 RMK AO2 SLP300 T00230023 $;

13 301255Z AUTO 07003KT 6000 BR CLR 02/02 A3041 RMK AO2 SLP299 T00200020 $;

14 301055Z AUTO 00000KT 9000 BR CLR 04/04 A3040 RMK AO2 SLP298 T00360036 $;

我放弃了试图改变一切来正确匹配。相反，我尝试创建一个新列，该列组合了第5列和第6列中以KT结尾的值的条目。我将为那些以T开头的值创建第二个新列

首先，我尝试从第5行和第6行中取出满足我的条件的所有数据，如下所示：

^{pr2}$

尝试合并iloc值。必须有一个更巧妙的方法来格式化它。有什么想法吗？在

如果有帮助，下面是一个更简单的数据集：row1=['a','b','c1K','d','e','foo','foo','f1111T','g','$']

row2=['a','b','foo','c2K','d','e','f4321T','g','$','$']

row3=['a','b','c3K','d','e','f1234T','g','$']

df=ps.DataFrame(zip(row1,row2,row3)).T

df1=df[df[2].str.contains("K")].iloc[:,[0,2]]

df2=df[df[3].str.contains("K")].iloc[:,[0,3]]

尝试海螺([df1，df2]，axis=0，join='outer')没有给出我想要的，它给出了0 2 3

0 a c1K NaN

2 a c3K NaN

1 a NaN c2K

像这样的东西会更漂亮：0

1 a c1K

2 a c3K

3 a c2K

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 导入数据对不齐_将Pandas DataFrame的参差不齐的行移动到使用部分字符串搜索清理数据...

从.csv文件导入数据后，我有一些类似的数据(尽管顺序是数百列和数千行)：4 5 6 7 8 9 10 11 12 13 14 15 160 302255Z 09005KT 1 1/4SM BR CLR M00/M00 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。