机器学习入门笔记——线性回归

最新推荐文章于 2023-09-03 10:17:31 发布

say_c_box

最新推荐文章于 2023-09-03 10:17:31 发布

阅读量651

点赞数

分类专栏：机器学习+深度学习文章标签：机器学习线性回归 octave 入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/say_c_box/article/details/54632908

版权

机器学习+深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

关于机器学习的应用场景

推荐算法
网页推荐
数据挖掘
无人驾驶
人工智能
智能医疗
…

机器学习的定义

计算机程序从经验E中学习任务T。并用度量P来衡量性能。条件是它由P定义的关于T的性能随着经验E而提高。

机器学习分类

监督性学习

回归问题->连续型数据

线性回归分析

训练集
函数： $h(x)=\theta_0+\theta_1x$
代价函数 $J{(\theta_0,\theta_1)=}{1\over 2m}\sum_{k=1}^m(h(x_i)-y_i)^2$

梯度下降法最小化代价函数值
$\theta_i:=\theta_i-\alpha*{\partial \over \partial\theta_i}J(\theta_i)$
$(\alpha为学习速率)$
越接近局部最小点变化越慢。
矩阵和向量
* 矩阵的维数等于矩阵的行数乘以矩阵的列数
* 向量可以被视为只有一列的矩阵

多个训练集的情况,即多元线性回归
多个训练集时，用向量标注。
$h(x)=\theta_0+\sum_{i=1}^m\theta_ix_i$ （可以看做是 $x_0$ 恒为1）

$x_j^{（i）}$ 表示第i个样本里头的第j个特征量

X= $\begin{pmatrix} x_0&x_1&x_2&…&x_n \end{pmatrix}$ $\theta = \begin{pmatrix} \theta_0&\theta_1&\theta_2&…&\theta_n \end{pmatrix}$

$h(x)=\theta^TX$

依次更新每一个 $\theta$ 的值： $\theta_j:=\theta_j-\alpha{1\over m}(h_\theta(x^i)-y^i)x^i_j(j从0循环到n)$

梯度下降法中的技巧

特征缩放（feature scaling）

关键在于保证特征值的范围大小相近，最好是将 $x_i$ 的范围大约约束到-1到1之间。（ $x_0$ 恒为1所以已经在范围之内了）

均值统一化(mean normalization)

将 $x_i$ 用 $x_i-u_i\over{s_i}$ 代替使得特征值的平均值接近0， $x_0$ 不用处理

选择合适的特征值

可以通过已有特征值定义新的，更合适的特征值。

多项式回归分析

比如现在的特征值为s， $h(x)=\theta_0+\theta_1x1+\theta_2x_2=\theta_0+\theta_2s+\theta_3s^2$ 那么就可以使 $x_1=s,x_2=s^2$ 将多项式回归转化成多元回归分析

标准方程法

$\theta={(X^TX)}^{-1}X^TY$ （其中X为一个(n+1)*m维矩阵用来表示m个训练集，Y为m维向量用来表示m个结果）

分类问题->离散型数据

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。