回归问题

最新推荐文章于 2024-04-29 11:23:04 发布

hmlo

最新推荐文章于 2024-04-29 11:23:04 发布

阅读量160

点赞数 1

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_48886850/article/details/114974631

版权

机器学习中的回归问题

机器学习的三要素是：模型，策略，算法

模型就是所要学习的条件概率分布或者决策函数
策略就是指要按照什么样的准则来学习
算法是指学习模型的具体计算方法

这次主要介绍的是回归模型

from sklearn import datasets     
import pandas as pd

boston = datasets.load_boston()     # 波士顿房价数据集，13个特征，1个结果(房价)
X = boston.data 
y = boston.target
features = boston.feature_names
boston_data = pd.DataFrame(X,columns=features)  # 转化为DataFrame格式
boston_data["Price"] = y   # 添加price这一列
boston_data.head()    # 查看结构

head(5)
各个特征的相关解释：
CRIM：各城镇的人均犯罪率
ZN：规划地段超过25,000平方英尺的住宅用地比例
INDUS：城镇非零售商业用地比例
CHAS：是否在查尔斯河边(=1是)
NOX：一氧化氮浓度(/千万分之一)
RM：每个住宅的平均房间数
AGE：1940年以前建造的自住房屋的比例
DIS：到波士顿五个就业中心的加权距离
RAD：放射状公路的可达性指数
TAX：全部价值的房产税率(每1万美元)
PTRATIO：按城镇分配的学生与教师比例
B：1000(Bk - 0.63)^2其中Bk是每个城镇的黑人比例
LSTAT：较低地位人口
Price：房价

主要包括线性回归，多项式回归，决策树回归
根据输入[[ $x_{1},y_{1}$ ],[ $x_{2},y_{2}$ ],…,[ $x_{n},y_{n}$ ]]和输出：[[ $\hat{y}_{1}$ ],[{ $\hat{y}_{2}$ ],…[ $\hat{y}_{n}$ ]]来训练模型，一般采用的策略为损失函数或风险函数最小化。当损失函数小于事先设定好的阈值之后模型就训练成功了，有了训练好之后的模型之后就可以进行预测了。
常用的损失函数有：
(1)0-1损失函数(0-1 loss function)
$L(Y,f(X))=\left\{ \begin{array}{rcl} 1 & & {0 < S_L}\\ 0 & & {S_L \leq 0 < S_M} \end{array} \right.$

最低0.47元/天解锁文章

hmlo

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
回归问题

机器学习中的回归问题机器学习的三要素是：模型，策略，算法模型就是所要学习的条件概率分布或者决策函数策略就是指要按照什么样的准则来学习算法是指学习模型的具体计算方法这次主要介绍的是回归模型主要包括线性回归，多项式回归，决策树回归根据输入[[x1,y1x_{1},y_{1}x1,y1],[x2,y2x_{2},y_{2}x2,y2],…,[xn,ynx_{n},y_{n}xn,yn]]和输出：[[y^1\hat{y}_{1}y^1],[{y^2\hat{y}_{2}y^2],…
复制链接

扫一扫