机器学习---基础算法二--回归实践

最新推荐文章于 2024-09-02 21:00:31 发布

王二小、

最新推荐文章于 2024-09-02 21:00:31 发布

阅读量165

点赞数

分类专栏：机器学习 #基础算法文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43056275/article/details/101306741

版权

机器学习同时被 2 个专栏收录

26 篇文章 2 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

课堂学习笔记

机器学习---基础算法二
- 回归

机器学习—基础算法二

https://blog.csdn.net/fan2312/article/details/100854485

回归

均方误差： $\frac{1}{m}\sum^m_{i=1}(y_i-\hat{y_i})^2$
均方根误差: 标准误差： $\sqrt{MSE}$
总平方和： $\sum^m_{i=1}(y_i-\overline{y})^2$
伪方差： $V a r (Y) = T S S / m$
残差平方和： $RSS=\sum^m_{i=1}(\hat{y_i} - y_i)^2$
- 即误差平方和 SSE
$R^2 = \frac{TSS-RSS}{TSS}=1-\frac{RSS}{TSS}$
- $R^2$ 越大，拟合效果越好
- $R^2$ 的最优值为1；若模型预测为随机值， $R^2$ 有可能为负
- 若预测值恒为样本期望， $R^2$ 为0
回归平方和： $ESS=\sum^m_{i=1}(\hat{y_i}-\overline{y})^2$
- $TSS\geq ESS+RSS$
- 只有无偏估计时， $T S S = E S S + R S S$
局部加权线性回归（LWR）
- 目标函数
- 权值的设置：
  - 高斯核函数
    - $w^{(i)}=\exp(-\frac{(x^{(i)}-x)^2}{2\tau^2})$
    - $\tau$ 称为带宽，控制训练样本随着与 $x^{(i)}$ 距离的衰减速率
  - 多项式核函数：
    - $\kappa(x_1,x_2) = (<x_1,x_2>+R)^d$
Logistic回归（sigmoid）
- $h_\theta(x)=g(\theta^Tx)=\frac{1}{1+e^{-\theta^{T}x}}$
- $g'(x)=(\frac{1}{1+e^{-x}})'=g(x)\cdot(1-g(x))$
- 参数估计
  - 假定
    - $P(y=1|x;\theta)=h_\theta(x)$
    - $P(y=0|x;\theta)=1-h_\theta(x)$
  - $p(y|x;\theta)=(h_\theta(x))^y(1-h_\theta(x))^{1-y}$
  - 似然函数： $L(\theta)=p(\overrightarrow{y}|X;\theta)$
    $=\prod^m_{i=1}p(y^{(i)}|x^{(i)};\theta)$
    $=\prod^m_{i=1}(h_\theta(x^{(i)}))^{y^{(i)}}(1-h_\theta(x^{(i)}))^{1-y^{(i)}}$
  - $l(\theta)=logL(\theta)=\sum^m_{i=1}y^{(i)}logh(x^{(i)})+(1-y^{(i)})log(1-h(x{^{(i)}}))$
  - $\frac{\partial l(\theta)}{\partial\theta_j}=\sum^m_{i=1}(y^{(i)}-g(\theta^Tx^{(i)}))\cdot x^{(i)}_j$
  - 参数更新
    - $\theta_j:=\theta_j+\alpha(y^{(i)}-h_\theta(x^{(i)}))x_j^{(i)}$
- 用于分类
- 损失
  - $y_i=\begin{Bmatrix}-1,1\end{Bmatrix}$
  - $\hat{y}_i=\begin{cases} p_i &y_i=1\\ 1-p_i & y_i=-1\end{cases}$
  - 似然函数 $L(\theta)=\prod^m_{i=1}p^{(y_i+1)/2}_i(1-p_i)^{-(y_i-1)/2}$
  - $lnL(\theta)\Rightarrow l(\theta)=\sum^m_{(i=1)}ln[p^{(y_i+1)/2}_i(1-p_i)^{-(y_i-1)/2}]$
    $\underrightarrow{p_i=\frac{1}{1+e^{-f_i}}} l(\theta)=\sum^m_{i=1}ln[(\frac{1}{1+e^{-f_i}})^{(y_i+1)/2}(\frac{1}{1+e^{f_i}})^{(y_{i}-1)/2})]$
  - $loss(y_i,\hat y_i)=-l(\theta)$
    = $\sum^m_{i=1}[\frac{1}{2}(y_i+1)ln(1+e^{-f_i})-\frac{1}{2}(y_i-1)ln(1+e^{f_i})]$
    = $\begin{cases}\sum^m_{i=1}[ln(1+e^{-f_i})] &y_i=1\\ \sum^m_{i=1}[ln(1+e^{f_i})] &y_i=-1\end{cases} \Rightarrow loss(y_i,\hat{y_i})=\sum^m_{i=1}[ln(1+e^{-y_i\cdot f_i})]$
对数线性模型
- 一个事件的机率odds，是指该事件发生的概率与该事件不发生概率的比值
- 对数几率：logit函数
  - $P(y=1|x;\theta)=h_\theta(x)$
  - $P(y=0|x;\theta)=1-h_\theta(x)$
  - $logit(p)=log\frac{p}{1-p}=log\frac{h_\theta(x)}{1-h_\theta(x)}=\theta^Tx$
Softmax回归
- K分类
  - 第k类的参数为 $\vec{\theta}_k$ ，组成二维矩阵 $\theta_{k\times n}$
- 概率
  - $p(c=k|x;\theta)=\frac{exp(\theta^T_kx)}{\sum^K_{l=1}exp(\theta^T_lx)}, k=1,2,…,K$
- 似然函数
  - $L(\theta)=\prod^m_{i=1}\prod^K_{k=1}p(c=k|x^{(i)};\theta)^{y^{(i)}_k}=\prod^m_{i=1}\prod^K_{k=1}(\frac{exp(\theta^T_kx)}{\sum^K_{l=1}exp(\theta^T_lx)})^{y^{(i)}_k}$
- 对数似然
  - $J(\theta)=\sum^K_{k=1}y_k\cdot(\theta^T_kx-ln\sum^K_{l=1}exp(\theta^T_lx^{(i)}))$
- 随机梯度
  - $\frac{\partial J(\theta)}{\partial \theta_k}=(y_k-p(y_k|x;\theta))\cdot x$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

王二小、 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。