python dataframe删除指定行_从python pandas中的DataFrame中删除特定行

最新推荐文章于 2024-07-10 16:57:50 发布

Liou Siaocing

最新推荐文章于 2024-07-10 16:57:50 发布

阅读量4.6k

点赞数

文章标签： python dataframe删除指定行

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36230821/article/details/114360186

版权

我有一个大的.txt数据格式不正确.我想删除一些行并将其余数据转换为浮点数.我想删除’X’或’XX’的行,其余的我应该转换为float,数字像4; 00.1应该转换为4.001该文件看起来像这样的样本：

0,1,10/09/2012,3:01,4;09.1,5,6,7,8,9,10,11

1,-0.581586,11/09/2012,-1:93,0;20.3,739705,,0.892921,5,,6,7

2,XX,10/09/2012,3:04,4;76.0,0.183095,-0.057214,-0.504856,NaN,0.183095,12

3,-0.256051,10/09/2012,9:65,1;54.9,483293,0.504967,0.074442,-1.716287,7,0.504967,0.504967

4,-0.728092,11/09/2012,0:78,1;53.4,232247,4.556,0.328062,1.382914,NaN,4.556,4

5,4,11/09/2012,NaN,NaN,6.0008,NaN,NaN,NaN,6.000800,6.000000,6.000800

6,X,11/09/2012,X,X,5,X,8,2,1,17.000000,33.000000

7,,11/09/2012,,,,,,6.000000,5.000000,2.000000,2.000000

8,4,11/09/2012,7:98,3;04.5,5,6,3,7.000000,3.000000,3.000000,2

9,6,11/09/2012,2:21,4;67.2,5,2,2,7,3,8.000000,4.000000

我把它读到DataFrame并选择行

from pandas import *

from csv import *

fileName = '~/data.txt'

colName = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l']

df = DataFrame(read_csv(fileName, names=colName))

print df[df['b'].isin(['X','XX',None,'NaN'])].to_string()

最后一行的输出只给我：

>>> print df[df['b'].isin(['X','XX',None,'NaN'])].to_string()

b c d e f g h i j k l

a

2 XX 10/09/2012 3:04 4;76.0 0.183095 -0.057214 -0.504856 NaN 0.183095 12 NaN

6 X 11/09/2012 X X 5.000000 X 8.000000 2 1.000000 17 33

不接受第7行,我想通过所有df而不仅仅是一列(原始文件非常大).

在转换时我使用如下,但需要首先删除不需要的行以将其应用于所有df.

convert1 = lambda x : x.replace('.', '')

convert2 = lambda x : float(x.replace(';', '.'))

newNumber = convert2(convert1(df['e'][0]))

选择行后我想从df中删除它们,我尝试df.pop()但它只适用于不适用于行的列.我试着命名行但不运气.在这个特定的.txt中,我应该用行[0,3,8,9]中的新df结束,列’c’作为日期格式,’d’作为时间格式,其余作为浮点数.我试着弄清楚它已经有一段时间了,但不知道在哪里移动,是否有可能在熊猫(可能应该)或者我是否需要更改为ndarray或其他任何东西？感谢您的意见

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python dataframe删除指定行_从python pandas中的DataFrame中删除特定行

我有一个大的.txt数据格式不正确.我想删除一些行并将其余数据转换为浮点数.我想删除’X’或’XX’的行,其余的我应该转换为float,数字像4; 00.1应该转换为4.001该文件看起来像这样的样本：0,1,10/09/2012,3:01,4;09.1,5,6,7,8,9,10,111,-0.581586,11/09/2012,-1:93,0;20.3,739705,,0.892921,5,,6...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。