Pandas中loc用法——索引、补全缺失值

loc——通过行标签索引行数据
loc[1]表示索引的是第1行(index 是整数)

import pandas as pd  
data = [[1,2,3],[4,5,6]]  
index = [0,1]  
columns=['a','b','c']  
df = pd.DataFrame(data=data, index=index, columns=columns)  
print df.loc[1]  
''''' 
a    4 
b    5 
c    6 
'''  

loc[‘d’]表示索引的是第’d’行(index 是字符)

import pandas as pd  
data = [[1,2,3],[4,5,6]]  
index = ['d','e']  
columns=['a','b','c']  
df = pd.DataFrame(data=data, index=index, columns=columns)  
print df.loc['d']  
''''' 
a    1 
b    2 
c    3 
'''  

实际应用,在补全缺失值时非常有帮助,例如在进行kaggle-titanic比赛的时候,

 df.loc[ (df.Age.isnull()), 'Age' ] = predictedAges 

使用随机森林获得的predictedAges 值,填补数据集中Age特征的缺失值,(df.Age.isnull())确定行,'Age' 确定列。

在将Cabin特征进行补全时,同样处理。

df.loc[ (df.Cabin.notnull()), 'Cabin' ] = "Yes"
df.loc[ (df.Cabin.isnull()), 'Cabin' ] = "No"
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值