李宏毅 机器学习回归、分类、聚类、异常检测视频笔记

https://www.bilibili.com/video/BV164411b7dx?p=90

线性回归

1.Model
A set of function一组函数

2.Goodness of Function评价函数
损失函数 L:
输入:函数,输出:衡量模型how bad is
在这里插入图片描述
3.Bset Funcion挑选最好的函数
在这里插入图片描述
梯度下降:可微分,找到合适的loss函数
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
衡量error
在这里插入图片描述
关注测试集误差
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

过拟合
在这里插入图片描述
隐藏因素

在这里插入图片描述

在这里插入图片描述
独热编码
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
其他隐藏因素
在这里插入图片描述
在这里插入图片描述

正则化

在这里插入图片描述
在这里插入图片描述
b上下平滑,不影响

结论

在这里插入图片描述

where does the error come from

Estimator评估器

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

偏差和方差

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
bias大欠拟合-重新设计模型,选择更复杂模型
在这里插入图片描述

variance大过拟合-增加数据量、正则化
在这里插入图片描述

model selection

在这里插入图片描述
交叉验证
在这里插入图片描述

K折交叉验证
在这里插入图片描述

分类

在这里插入图片描述

在这里插入图片描述后置概率
在这里插入图片描述

在这里插入图片描述

使用回归做分类

在这里插入图片描述
在这里插入图片描述

loss function:
分类错误的次数
在这里插入图片描述
在这里插入图片描述
高斯分布
在这里插入图片描述
在这里插入图片描述

极大似然函数maximun likelihood
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

逻辑回归

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
MSE与logistic函数作为loss对分类影响
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
高斯分布 Generative 假设
logistic Discriminative
请添加图片描述

生成模型 vs Discriminative

生成模型优势:
需要更少数据
对噪音不敏感,更健壮
前置和类别可能性拆开可能性,可以来自不同来源
请添加图片描述

多类

每个类的概率和为1
请添加图片描述

请添加图片描述

logistic 回归限制性

边界是线性的请添加图片描述
使用过个logistic回归组合请添加图片描述

请添加图片描述
请添加图片描述

非监督学习

  • 聚类和降维
  • Generation无中生有

聚类

K均值聚类

在这里插入图片描述

层次聚类

Hierarchical Agglomerative Clustering (HAC)
在这里插入图片描述

分布式表示 Distributed Representation

一个点一定是一个类,以偏概全
在这里插入图片描述

降维

在这里插入图片描述
特征选择、PCA
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
W是正交矩阵
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
每次投影让方差最大

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

PCA Compnent
在这里插入图片描述
在这里插入图片描述

PCA与Neral 两组解

PCA缺点

在这里插入图片描述
线性判别分析LDA:
参考:https://www.jianshu.com/p/13ec606fdd5f
在这里插入图片描述
component 可以加,减

在这里插入图片描述
NMF on MNIST
在这里插入图片描述
在这里插入图片描述

矩阵分解

在这里插入图片描述

在这里插入图片描述
没有的值久不算
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

词嵌入

Neighbor Embedding

manifold learning

在这里插入图片描述
locally linear embedding
在这里插入图片描述
LLE
在这里插入图片描述

在这里插入图片描述
请添加图片描述
请添加图片描述

异常检测

如果数据符合高斯分布,均值为i,方差为sigma,
可以根据特征的值算概率值,判断是否异常
在这里插入图片描述

PCA应用建议

1.压缩数据,减少存储成本
2.加快计算

在这里插入图片描述
不建议:
1.防止过拟合
2.一开始就用PCA降维后的数据拟合模型,而不是完整的数据

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值