[[0. 0.38 0.45 0.14 0.03]
[0. 0. 0.08 0.16 0.76]
[0. 0. 0.08 0.16 0.76]
[0. 0. 0.08 0.16 0.76]]
Process finished with exit code 0
1.2 案例2
情景:基于相亲网站男方提供的个人基本资料作为输入,以女方是否相亲做标签做训练,用训练出的模型预测女方是否相亲。
#导包=
from sklearn.ensemble import RandomForestClassifier
#“年龄”, “身高”, “年收入”, ‘学历’(0:大专, 1:本科, 2:硕士)
X = [
[25, 179, 15, 0],
[33, 190, 19, 0],
[28, 180, 18, 2],
[25, 178, 18, 2],
[46, 100, 100, 2],
[40, 170, 170, 1],
[34, 174, 20, 2],
[36, 181, 55, 1],
[35, 170, 25, 2],
[30, 180, 35, 1],
[28, 174, 30, 1],
[29, 176, 36, 1],
]
#=有否相亲 0:N 1:Y=========
y = [0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1]
#现在我们把训练数据,和对应的分类放入分类器中进行训练
model = RandomForestClassifier().fit(X, y)
#预测下面此人是否相亲
p = [[28, 180, 18, 2]]
print(model.predict§)
[1]
Process finished with exit code 0
输出结果是[1] 是
2 数据集划分(train_test_split)
2.1 用途
在机器学习中,该函数可按照用户设定的比例,随机将样本集合划分为_训练集_