机器学习(浙大课程b站)第六章

机器学习(浙大课程b站)第六章:传统机器学习

笔记

  1. 特征提取-主成分分析(Principle Component Analysis, PCA)
    在这里插入图片描述
    主成分分析本质是寻找使方差最大的方向,并在该方向投影。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    Mooc上的清楚一点:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    PCA算法:
    在这里插入图片描述
    在这里插入图片描述
    更正:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    总结:如果特征数量大且可能存在冗余,用PCA降维往往能收到好的效果,这也就是PCA在机器学习中被广泛运用的原因。
    这带来一个问题:PCA需要降维到什么程度?即Y的维度M如何确定?
    采取能量百分率准则:
    在这里插入图片描述
    一般选取在这里插入图片描述
  2. 特征选择:自适应提升算法(Adaptive Boosting, AdaBoost)
    核心思想:融合一些弱分类器获得强分类器
    ADABOOST的核心流程: 先用一部分特征训练-些较弱的分类器然后再将这些较弱的分类器逐步提升为强的分类器。ADABOOST的核心是调整训练样本的分布,使得先前分类器做错的训练样本在后续学习中获得更多的关注,然后基于调整后的样本分布来训练下一个分类器。最后再用权重系数将获得的各个弱分类器组合起来形成强分类器。
    在这里插入图片描述
    自适应提升算法(AdaBoost)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  3. 目标检测(RCNN, FCN)
    在这里插入图片描述
    在这里插入图片描述
    RCNN: Regional CNN
    Region Proposal: 目标候选区域
    Selective Search: 产生RP
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  4. 概率分类法概述
    在这里插入图片描述
  5. 概率密度估计-朴素贝叶斯分类器(Naïve Bayesian Classifier)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  6. 概率密度估计-高斯概率密度估计
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  7. 高斯混合模型(Gaussian Mixture Model)
    实际数据是两个或者多个高斯分布的线性叠加
    假设:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  8. EM算法(高斯混合模型和K-均值算法)
    高斯混合模型
    在这里插入图片描述
    非凸函数无法求全局极值,只能求局部极值
    这里主要讲EM算法,它只对某一类局部极值问题可解,优点:①不需要调任何参数,都是收敛的。②编程简单。③理论优美。
    EM算法:固定一个求另一个,不断循环迭代
    在这里插入图片描述
    高斯混合模型的EM算法(Expectation-Maximization)
    在这里插入图片描述
    在这里插入图片描述
    另一个EM算法的例子:K-均值聚类(K-means Clustering)
    如何让机器自动聚类?
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    Mooc和课堂上的K-均值算法步骤有些许差别
    在这里插入图片描述
    在这里插入图片描述
    K-均值算法求得的是目标函数E的局部极值
    在这里插入图片描述
  9. EM算法收敛性证明
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  10. 语音识别(Speech Recognition) 隐含马尔科夫过程
    连续行为的识别
    ① 隐含马尔科夫过程(Hidden Markov Model, HMM)(后一个状态只与前一个状态有关)②递归神经网络(Recurrent Neural Networks, RNN)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    维特比算法(Viterbi Algorithm)
    在这里插入图片描述
    在这里插入图片描述
    问题二是给O打标签的操作
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    这之后求B的过程,在b站上少了这部分,下面是老师的笔记
    在这里插入图片描述
  11. 大词汇量连续语音识别(LVCSR)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    这一小节可以说是没听懂
  12. 循环神经网络RNN和LSTM
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  13. 人工智能中的哲学
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

测验

1.‏使用K均值聚类算法得到3个聚类中心:(2,4),(3,3)(4,-2),现输入数据((1,-1),那么这个输入的数据属于第几类
A.第二类
B.第一类
C.不一定
D.第三类
正确答案:D

2.K-means算法()能收敛,对于无标签的数据X,经过n次聚类后,优化目标函数值()的一组结果是最优的。
A.一定,最大
B.不一定,最小
C.一定,最小
D.不一定,最大
正确答案:C

3.‎假设有A个输入的样本,它的特征维度是B,那么在设置压缩后的维度M时,以下哪些操作是合理的()
A.M=0.1A
B.根据能量百分率准则,保留占据1%能量的M值
C.根据能量百分率准则,保留占据99%能量的M值
D.M=0.1
B
正确答案:C、D

4.K均值算法求得的是目标函数的全局极值

B.√
正确答案:A

至此,我的机器学习(浙大课程b站)学习之旅就结束啦,当然这也只是一个开始,是一个终点也是一个起点。机器学习还有很多很多知识等待我去探索发现。其实我的笔记中可以看出,一开始的课程还是能跟上的,后来就逐渐听不太懂了,主要以课堂上老师讲解的过程为主进行截图,而且我没有进行实际的编程,只是在学习理论。相信编程和理论相结合一定能更好地理解其中的知识,所以这次学习之旅也只是一个开始罢了。

《机器学习——从入门到入门后》

附上我看网课时候笑得不行的一张截图
在这里插入图片描述

  • 3
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值