3.线性模型

最新推荐文章于 2024-08-14 11:14:24 发布

Baijiu in my cup

最新推荐文章于 2024-08-14 11:14:24 发布

阅读量61

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_50224852/article/details/129785345

版权

机器学习复习（三）：线性模型

一、基本形式

二、线性回归

$D=\{(\bold{x_1},y_1),\dots,(\bold{x_i},y_i),\dots,(\bold{x_m},y_m)\}$

其中， $\bold{x_i}=(x_{i1};x_{i2};\dots;x_{id}),\quad y_i \in \mathbb{R}$

$d = 1$

最简单，输入属性的数目只有一个

即， $D=\{(x_i,y_i)\}_{i=1}^m$ ,其中 $x_i \in \mathbb{R}$

数据预处理

属性：

连续属性
离散属性
- 属性值间存在序关系
  - 连续化 $\to$ 连续值
- 不存在序关系
  - 向量化 $\to$ $k$ 维向量

模型

$f(x_i)=wx_i+b \quad$ ,使 $f(x_i)\backsimeq y_i$

确定 $w, b$ ，参数估计

均方误差（平方损失）最小化，即

$KaTeX parse error: {split} can be used only in display mode.$

最小二乘法：基于均方误差最小化进行模型求解的方法

$E(w,b)=\sum_{i=1}^m(y_i-wx_i-b)^2$

$\frac{\partial{E(w,b)}}{\partial{w}}=\cdots=0$

$\frac{\partial{E(w,b)}}{\partial{b}}=\cdots=0$

解得：

$w=\frac{\sum_{i=1}^m(x_i-\overline{x})(y_i-\overline{y})}{\sum_{i-1}^m(x_i-\overline{x})^2}$

$b=\frac{1}{m}\sum_{i=1}^m(y_i-wx_i)$

多元线性回归

引入正则化项

对数线性回归

广义线性模型

三、对数几率回归

分类学习方法，预测结果：类别、概率

单位阶跃函数：

$KaTeX parse error: \tag works only in display equations$

单位阶跃函数不连续

对数几率函数（Sigmoid函数）：

$KaTeX parse error: \tag works only in display equations$

极大似然法

四、线性判别分析LDA

思想：

给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离
在对新样本进行分类时，将其投影到同样的这条直线上，再根据投影点的位置来确定样本的类别

投影维度$d^{'}\quad \leq \quad $分类数$ N-1$

降维：

PCA
LDA：有监督

五、多分类学习

拆分策略

$D=\{(\bold{x_1},y_1),\dots,(\bold{x_m},y_m)\},$

$y_i \in \{C_1,C_2,\dots,C_N\}$

一对一 ${OvO}$
- 两两配对，== $\frac{N(N-1)}{2}$ ==个二分类任务
- 投票
一对其余 $O v R $
- 一个类的样例作为正例、所有其他类的样例作为反例，== $N $ ==个分类器
- 置信度
多对多 $M v M $
- 纠错输出码
- 距离

六、类别不平衡问题

基本策略：再缩放（再平衡）

若 $\frac{y}{1-y} > \frac{m^+}{m^-}$ ，则预测为正例

实际执行， $KaTeX parse error: \tag works only in display equations$

假设：训练集是真实样本总体的无偏采样

实际：很难实现

现有技术三类做法：

欠采样
- 去除反例，使正反例数目接近
过采样
- 增加正例，使正反例数目接近
阈值移动
- 直接基于原始数据集，式 $3.61$ 嵌入其决策过程

Baijiu in my cup

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3.线性模型

D{(x1y1xiyixmym)}其中，xixi1;xi2;;xidyi∈Rd1最简单，输入属性的数目只有一个即，D{(xiyii1m,其中xi∈R。
复制链接

扫一扫

Baijiu in my cup CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

186万+: 周排名

89万+: 总排名

505: 访问

: 等级

41: 积分

0: 粉丝

0: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

分类专栏

笔记

最新评论

使用pytorch实现LSTM语言模型
CSDN-Ada助手: 恭喜作者写出了如此精彩的博客！使用pytorch实现LSTM语言模型是一个非常不错的主题，我在读完博客后受益匪浅。我期待着作者能够继续写出更多关于深度学习的博客，并且我建议下一步可以尝试一些更加复杂的模型，挑战自己，提升技术。再次感谢作者的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
2.模型评估与选择
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。