李宏毅机器学习回归、分类、聚类、异常检测视频笔记

最新推荐文章于 2023-10-12 21:04:27 发布

飞锡2024

最新推荐文章于 2023-10-12 21:04:27 发布

阅读量377

点赞数

分类专栏：机器学习文章标签：机器学习回归分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38235865/article/details/121174121

版权

机器学习专栏收录该内容

29 篇文章 3 订阅

订阅专栏

https://www.bilibili.com/video/BV164411b7dx?p=90

线性回归

1.Model
A set of function一组函数

2.Goodness of Function评价函数
损失函数 L:
输入：函数，输出：衡量模型how bad is
在这里插入图片描述
3.Bset Funcion挑选最好的函数

梯度下降：可微分，找到合适的loss函数

在这里插入图片描述

衡量error

关注测试集误差

在这里插入图片描述

过拟合
在这里插入图片描述
隐藏因素

在这里插入图片描述

在这里插入图片描述
独热编码

其他隐藏因素

正则化

在这里插入图片描述

b上下平滑，不影响

结论

在这里插入图片描述

where does the error come from

Estimator评估器

在这里插入图片描述

偏差和方差

在这里插入图片描述

bias大欠拟合-重新设计模型，选择更复杂模型

variance大过拟合-增加数据量、正则化
在这里插入图片描述

model selection

在这里插入图片描述
交叉验证

K折交叉验证
在这里插入图片描述

分类

在这里插入图片描述

在这里插入图片描述后置概率

在这里插入图片描述

使用回归做分类

在这里插入图片描述

loss function:
分类错误的次数
在这里插入图片描述

高斯分布

极大似然函数maximun likelihood
在这里插入图片描述

在这里插入图片描述

逻辑回归

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

MSE与logistic函数作为loss对分类影响

高斯分布 Generative 假设
logistic Discriminative
请添加图片描述

生成模型 vs Discriminative

生成模型优势：
需要更少数据
对噪音不敏感，更健壮
前置和类别可能性拆开可能性，可以来自不同来源
请添加图片描述

多类

每个类的概率和为1
请添加图片描述

请添加图片描述

logistic 回归限制性

边界是线性的请添加图片描述
使用过个logistic回归组合

请添加图片描述

非监督学习

聚类和降维
Generation无中生有

聚类

K均值聚类

在这里插入图片描述

层次聚类

Hierarchical Agglomerative Clustering (HAC)
在这里插入图片描述

分布式表示 Distributed Representation

一个点一定是一个类，以偏概全
在这里插入图片描述

降维

在这里插入图片描述
特征选择、PCA

W是正交矩阵

每次投影让方差最大

在这里插入图片描述

PCA Compnent
在这里插入图片描述

PCA与Neral 两组解

PCA缺点

在这里插入图片描述
线性判别分析LDA:
参考：https://www.jianshu.com/p/13ec606fdd5f

component 可以加，减

在这里插入图片描述
NMF on MNIST

矩阵分解

在这里插入图片描述

在这里插入图片描述
没有的值久不算

词嵌入

Neighbor Embedding

manifold learning

在这里插入图片描述
locally linear embedding

LLE

在这里插入图片描述
请添加图片描述

异常检测

如果数据符合高斯分布，均值为i,方差为sigma，
可以根据特征的值算概率值，判断是否异常
在这里插入图片描述

PCA应用建议

1.压缩数据，减少存储成本
2.加快计算

在这里插入图片描述
不建议：
1.防止过拟合
2.一开始就用PCA降维后的数据拟合模型，而不是完整的数据

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习回归、分类、聚类、异常检测视频笔记

线性回归1.ModelA set of function一组函数2.Goodness of Function评价函数损失函数 L:输入：函数，输出：衡量模型how bad is3.Bset Funcion挑选最好的函数梯度下降：可微分，找到合适的loss函数衡量error关注测试集误差过拟合隐藏因素独热编码其他隐藏因素正则化b上下平滑，不影响结论where does the error come fromEstimator评
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。