小白记录——使用pandas的iloc的注意事项

最新推荐文章于 2024-09-03 17:22:28 发布

a2345ddee

最新推荐文章于 2024-09-03 17:22:28 发布

阅读量110

点赞数 2

文章标签： pandas python 机器学习

本文链接：https://blog.csdn.net/a2345ddee/article/details/138704603

版权

想用自助法划分数据集并输出训练集内的某些数据

df = pd.read_excel(filename)
y = df['目标值'].values
X=df.loc[:,'特征值']
X_train1 = X.sample(frac=1.0,replace=True)
X_test = X.loc[X.index.difference(X_train1.index)].copy()
y_test=y[X.index.difference(X_train1.index)]
y_train=y[X_train1.index]
print(X_train1.iloc[:,1][0])#这里报错

最后一行时而报错时而跑通

主要原因是iloc是根据DataFrame中的标号输出，而不是按照元素顺序，X_train1.iloc[:,1][0]输出的是第一列，对应索引值为“0”的行的内容。由于我是自助法采样，可能没有收集到行索引值为“0”的数据。

改进方法是改为X_train1.iloc[:,1].index[0]即可

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

a2345ddee

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
小白记录——使用pandas的iloc的注意事项

主要原因是iloc是根据DataFrame中的标号输出，而不是按照元素顺序，X_train1.iloc[:,1][0]输出的是第一列，对应索引值为“0”的行的内容。由于我是自助法采样，可能没有收集到行索引值为“0”的数据。改进方法是改为X_train1.iloc[:,1].index[0]即可。想用自助法划分数据集并输出训练集内的某些数据。最后一行时而报错时而跑通。
复制链接

扫一扫