数据挖掘中的机器学习库scikit-learn,简称:sklearn
功能:分类、回归、降维、聚类四个机器学习算法和特征提取、数据处理、模型评估三个模块
安装:pip install sklearn
决策树sklearn.tree使用demo
from sklearn import tree
# 训练数据
feature = [[178, 1], [155, 0], [177, 0], [165, 0], [169, 1], [169, 0]]
# 性别分类
label = ['男', '女', '男', '女', '男', '女']
# 创建决策树分类器实例
clf = tree.DecisionTreeClassifier()
# 拟合训练数据,得到训练模型参数
clf = clf.fit(feature, label)
# 预测数据1,并输出预测结果
s1 = clf.predict([[158, 0]])
print(u'第1个测试的人预计性别是:', s1[0])
# 预测数据2,并输出预测结果
s2 = clf.predict([[176, 1]])
print(u'第2个测试的人预计性别是:', s2[0])
结果: