(CSDN是SB,保存文章就给我保存个标题,你麻麻没了,CSDN)
同时还有这样一个错误,经常与标题同时出现:
KeyError: "None of [Int64Index([1,,\n dtype='int64', length=22919547)] are in the [columns]"
老样子,先说过程
1,错误代码:
![](https://i-blog.csdnimg.cn/blog_migrate/d1b8c1ff78bbe553da7552001572c381.png)
![](https://i-blog.csdnimg.cn/blog_migrate/fc98da649044ec7c8a55c431f2445f0e.png)
错误代码如下:
dataset=pd.get_dummies(dataset,columns=dataset[['用户性别','用户职业','用户教育程度','用户婚姻状态','用户户口类型']]).drop(['标签'],axis=1)
2,分段处理查看数据,结果如下:
![](https://i-blog.csdnimg.cn/blog_migrate/55bd4117208f6794831bb0c20eb51ad0.png)
3,此时将代码更改如下会出现第二种报错
代码:
dataset=pd.get_dummies(dataset,columns=dataset['用户性别']).drop(['标签'],axis=1)
报错:
KeyError: "None of [Int64Index([1,,\n dtype='int64', length=22919547)] are in the [columns]"
4,不得已换个方式,代码如下:
# 选取我们所需要的列名
column = ['用户性别','用户职业','用户教育程度','用户婚姻状态','用户户口类型']
# 一个一个的进行处理,并连接到数据集的后面
for i in column:
x =pd.get_dummies(dataset[i],prefix= i)
dataset=pd.concat([dataset,x],axis=1)
# 显示转换后的数据
#dataset.head()
结果:
![](https://i-blog.csdnimg.cn/blog_migrate/f5bd135a9ccd7479dc30ed6f7032ce91.png)
与所需结果一样,虽然不知道咋错了,解决了就万事大吉了
参考文献:(6条消息) 快速进行OneHot编码——get_dummies()函数_寂ღ᭄秋࿐的博客-CSDN博客_getdummies函数作用