pandas进行数据预处理

对.csv文件的处理

在处理.CSV文件时,总会遇到列表的添加删除,查找符合条件的元素下标,并需要对其进行处理的操作。下面将介绍如何查找符合条件的元素以及如何对其赋值的操作。

第一步,将pandas.dataframe类型转换为numpy类型,例如:

data['Labels'].values,可将列表Labels的值提取并转换成numpy类型。

参考链接:

https://blog.csdn.net/flyfrommath/article/details/69388675

https://blog.csdn.net/qq_30163461/article/details/80080529

第二步,筛选出符合条件的下标

a = [(data['Position X']==i)&(data['Position Y']==j)

b = [(df['PCTL']<0.95) & (df['PCTL']>0.05)]

以上两行操作返回bool值,通过(data['Labels'].values)[a]可直接打印出相应特征对应行元素的值。

参考链接:

https://jingyan.baidu.com/article/0eb457e508b6d303f0a90572.html

https://www.cnblogs.com/xinping-study/p/7289468.html

第三步,对相应元素进行操作,例如:

(data['Labels'].values)[a] = k

 

相应代码:

# 添加列元素 及 提取符合条件元素下标(通过装换成numpy形式)
# for example
# print df[(df['PCTL']<0.95) & (df['PCTL']>0.05)]

data['Labels'] = 0

k = 1
for i,j in [(122,180),(79,180),(165,180),(122,137),(122,223)]:
    a = [(data['Position X']==i)&(data['Position Y']==j)]
    (data['Labels'].values)[a] = k
    k += 1
    
#print(a)
#print(data)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值