小白记录——使用pandas的iloc的注意事项

想用自助法划分数据集并输出训练集内的某些数据

df = pd.read_excel(filename)
y = df['目标值'].values
X=df.loc[:,'特征值']
X_train1 = X.sample(frac=1.0,replace=True)
X_test = X.loc[X.index.difference(X_train1.index)].copy()
y_test=y[X.index.difference(X_train1.index)]
y_train=y[X_train1.index]
print(X_train1.iloc[:,1][0])#这里报错

最后一行时而报错时而跑通

主要原因是iloc是根据DataFrame中的标号输出,而不是按照元素顺序,X_train1.iloc[:,1][0]输出的是第一列,对应索引值为“0”的行的内容。由于我是自助法采样,可能没有收集到行索引值为“0”的数据。

改进方法是改为X_train1.iloc[:,1].index[0]即可

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值