机器学习算法--python实现决策树回归

最新推荐文章于 2024-06-26 00:28:52 发布

糯米君_

最新推荐文章于 2024-06-26 00:28:52 发布

阅读量1.5k

点赞数 3

分类专栏：机器学习算法文章标签：决策树 python 机器学习算法

本文链接：https://blog.csdn.net/fgg1234567890/article/details/110295260

版权

机器学习算法专栏收录该内容

43 篇文章 8 订阅

订阅专栏

决策树算法的一个优点是，如果处理非线性数据，它不需要对特征进行任何转换。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor

# 观察线性回归与训练数据的吻合程度
def lin_regplot(X, y, model):
    # s：指定散点图点的大小，默认为20，通过传入新的变量，实现气泡图的绘制
    # c：指定散点图点的颜色，默认为蓝色
    # edgecolors：设置散点边界线的颜色
    plt.scatter(X, y, c='steelblue', edgecolor='white', s=70)
    plt.plot(X, model.predict(X), color='black', lw=2)
    return

df = pd.read_csv('xxx\\housing.data.txt',
                 header=None,
                 sep='\s+')

df.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS',
              'NOX', 'RM', 'AGE', 'DIS', 'RAD',
              'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
print(df.head())

X = df[['LSTAT']].values
y = df['MEDV'].values

tree = DecisionTreeRegressor(max_depth=3)
tree.fit(X, y)

sort_idx = X.flatten().argsort()

lin_regplot(X[sort_idx], y[sort_idx], tree)
plt.xlabel('% lower status of the population [LSTAT]')
plt.ylabel('Price in $1000s [MEDV]')
#plt.savefig('images/10_13.png', dpi=300)
plt.show()

运行结果：
CRIM ZN INDUS CHAS NOX … TAX PTRATIO B LSTAT MEDV
0 0.00632 18.0 2.31 0 0.538 … 296.0 15.3 396.90 4.98 24.0
1 0.02731 0.0 7.07 0 0.469 … 242.0 17.8 396.90 9.14 21.6
2 0.02729 0.0 7.07 0 0.469 … 242.0 17.8 392.83 4.03 34.7
3 0.03237 0.0 2.18 0 0.458 … 222.0 18.7 394.63 2.94 33.4
4 0.06905 0.0 2.18 0 0.458 … 222.0 18.7 396.90 5.33 36.2

[5 rows x 14 columns]

运行结果图：
在这里插入图片描述

糯米君_

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法--python实现决策树回归

决策树算法的一个优点是，如果处理非线性数据，它不需要对特征进行任何转换。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.tree import DecisionTreeRegressor# 观察线性回归与训练数据的吻合程度def lin_regplot(X, y, model): # s：指定散点图点的大小，默认为20，通过传入新的变量，实现气泡图的绘制 # c：指
复制链接

扫一扫

专栏目录