sklearn的决策树和随即森林的demo

最新推荐文章于 2023-03-12 22:09:12 发布

月疯

最新推荐文章于 2023-03-12 22:09:12 发布

阅读量679

点赞数 2

分类专栏：【人工智能AI】文章标签：决策树 sklearn 机器学习

本文链接：https://blog.csdn.net/chehec2010/article/details/126443360

版权

【人工智能AI】专栏收录该内容

57 篇文章 8 订阅

订阅专栏

以下demo的大概意思：选择是否相亲是标签y，特征是年龄、身高、年收入、学历。

最后是测试，我输入年龄、身高、年收入、学历。模型判断我是否需要选择相亲。

1、sklearn中对应的函数DecisionTreeClassifier函数（分类），DecisionTreeRegressor（回归），分类代码如下：

from sklearn import tree
import numpy as np
 
#年龄，身高，年收入，学历（大专：0，本科：1，硕士：2）
X = np.array(
        [[25, 179, 15, 0],
         [33, 190, 19 ,0], 
         [28, 180, 18, 2],
         [25, 178, 18, 2], 
         [46, 100, 100, 2],
         [40, 170, 170, 1],
         [34, 174, 20, 2],
         [36, 181, 55, 1],
         [35, 170, 25, 2],
         [30, 180, 35, 1],
         [28, 174, 30, 1],
         [29, 176, 36, 1]])
 
#0表示没有相亲，1表示相亲
y= [0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1]
 
clf = tree.DecisionTreeClassifier().fit(X, y)
p=[[28, 180, 18, 2]]
print(clf.predict(p)) #[1]

2、sklearn中对应的函数RadomForestClassifier函数（分类），RadomForestRegressor（回归）

from sklearn.ensemble import RandomForestClassifier
import numpy as np
 
#年龄，身高，年收入，学历（大专：0，本科：1，硕士：2）
X = np.array(
        [[25, 179, 15, 0],
         [33, 190, 19 ,0], 
         [28, 180, 18, 2],
         [25, 178, 18, 2], 
         [46, 100, 100, 2],
         [40, 170, 170, 1],
         [34, 174, 20, 2],
         [36, 181, 55, 1],
         [35, 170, 25, 2],
         [30, 180, 35, 1],
         [28, 174, 30, 1],
         [29, 176, 36, 1]])
 
#0表示没有相亲，1表示相亲
y= [0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1]
 
clf =RandomForestClassifier().fit(X, y)
p=[[28, 180, 18, 2]]
print(clf.predict(p)) #[1]

决策树的架构比较：

ID3、C4.5、CART的区别