sklearn使用pd数据集进行训练决策树模型

@sklearn使用pd数据集进行训练模型

读取数据

sklearn训练数据时需要有特征行和类别行,有时候经过pd处理的数据集无法直接满足需求。

代码示例

处理数据代码如下:

import pandas as pd
data=pd.DataFrame({'特征1':[1,2,3],'特征2':[3,2,1],'类别':[4,5,6]})
print(data)
x=data.iloc[:,:2].values
y=data.iloc[:,2].values
print(x)
print(y)

经过处理,提取pandas处理后的每个数据前两列作为特征,最后一列作为类别

绘制决策树时参数赋值:

dot_data=export_graphviz(dtc,out_file=None,feature_names['特征1','特征2'],class_names['4','5','6'],filled=True,rounded=True,special_characters=True)
graph = pydotplus.graph_from_dot_data(dot_data)
graph.write_png('决策树.png')

iloc函数详解:

(转载:Pandas中loc和iloc函数用法详解(源码+实例)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值