机器学习基础模型回顾

最新推荐文章于 2024-07-20 17:10:09 发布

CuCu011

最新推荐文章于 2024-07-20 17:10:09 发布

阅读量213

点赞数

分类专栏： datawhale 文章标签：机器学习

本文链接：https://blog.csdn.net/m0_55106019/article/details/118770313

版权

本文介绍了机器学习的基础概念，包括数据的定义、有监督学习和无监督学习。详细讨论了线性回归模型，特别是最小二乘法在求解线性回归参数中的应用。同时，提到了机器学习项目的完整流程，使用sklearn库构建回归项目，并给出了关于线性回归、多项式回归、决策树模型和KKT条件等相关作业问题。

摘要由CSDN通过智能技术生成

1 导论

1.1 什么是机器学习？

机器学习的一个重要目标就是利用数学模型来理解数据，发现数据中的规律，用作数据分析和预测。

1.1.1 数据？

数据通常由一组向量组成，这组向量中的每一个向量都是一个样本，我们用 $x_{i}$ 来表示一个样本，其中 $i = 1, 2, 3 . . . N$ ，共 $N$ 个样本。每个样本 $x_{i} = \left ( x_{i1},x_{i2}...x_{ip},y_{i} \right )$ 共 $p + 1$ 个维度，$ x_{i1},x_{i2}…x_{ip} $称为特征，$ y_{i} $称为因变量或者响应变量。特征用来描述影响因变量$ y_{i}$的因素。例如，我们要探寻身高是否会影响体重的关系的时候，身高就是一个特征，体重就是因变量。

通常在一个数据表 $d a t a f r a m e$ 里面，一行表示一个样本 $x_{i}$ ，一列表示一个特征。

对数据形式的约定：

第 $i$ 个样本： $x_{i} = \left ( x_{i1},x_{i2}，...，x_{ip},y_{i} \right )^{T}$ ， $i = 1, 2, 3 . . . N$
因变量 $\left ( y_{1}, y_{2}，...，y_{N}\right )^{T}$
第 $k$ 个特征： $x^{\left ( k \right )} = \left ( x_{1k}, x_{2k} ,..., x_{Nk} \right )^{T}$
特征矩阵 $\left ( x_{1},x_{2}，...，x_{N} \right )^{T}$

1.1.2 有监督学习和无监督学习

根据数据是否有因变量，机器学习的任务可分为：有监督学习和无监督学习。

有监督学习：给定某些特征去估计因变量，即因变量存在的时候，我们称这个机器学习任务为有监督学习。例如，我们用房间面积、房屋所在地区、环境等级等因素去预测某个地区的房价。

根据因变量是否连续，有监督学习分为回归和分类。

最低0.47元/天解锁文章

CuCu011

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础模型回顾

1 导论1.1 什么是机器学习？机器学习的一个重要目标就是利用数学模型来理解数据，发现数据中的规律，用作数据分析和预测。1.1.1 数据？数据通常由一组向量组成，这组向量中的每一个向量都是一个样本，我们用xix_{i}xi来表示一个样本，其中i=1,2,3...Ni = 1,2,3...Ni=1,2,3...N，共NNN个样本。每个样本xi=(xi1,xi2...xip,yi)x_{i} = \left ( x_{i1},x_{i2}...x_{ip},y_{i} \right )xi
复制链接

扫一扫