Chapter 1 引言
课程笔记总览传送门:https://blog.csdn.net/weixin_42900928/article/details/86523192
**1. 什么是机器学习?**
答:一个程序,从经验E中学习→去做任务T→达到量化的要求值P,然后,程序从E中学习,经过P的评判,不断优化解决任务T的过程。
**2. 机器学习包括哪些主要算法?**
答:主要的两种类型:监督学习 和 无监督学习。
**3. 什么是监督学习?**
答:~~监督学习——数据集中的每个样本都有“正确答案”,根据这些样本进行预测。~~ 其实用比较熟悉的概念说,监督学习就是回归和分类的另一种表达。连续值的回归是监督学习,离散值的分类也是监督学习(如下两张图)。上面房价预测就是回归问题,而下面关于肿瘤大小与癌症关系的例子是一个简单的01分类。
通过房价例子说明:监督学习就是给你一个数据集,里面包括房间大小和与大小对应的价格(价格就是所谓的“正确答案”),然后根据现有的两者对应关系画出直线、曲线等尽可能可以拟合原样本的函数,这是第一步;接着,挑一个样本中没有的房间大小基于第一步拟合的函数进行预测,这是第二步。
值得注意的是,分类不仅包括0,1分类,0,1,2,...也是分类问题,就像下图展示的一样。
**4. 什么是无监督学习?**
答:有了监督学习的概念,无监督学习就很好理解了,把“正确答案”去掉就是了,无监督学习是一种让程序自己找规律、结构、边界等等的算法。同样地,聚类分析可以当作“概念的暂时替代品”。
拿肿瘤的例子,↑是监督学习,↓是无监督学习。可以看到,监督学习是给出什么情况下肿瘤会是癌症,功能:在这两个特征的情况下,预测肿瘤是不是癌症。而无监督学习只给了2个特征,没有说在什么情况下,那些蓝圈即样本点代表着什么,因此无监督学习在这个例子的功能:不明确,也许和监督学习一致是预测癌症,也许是简单聚类;但可以预见的是无监督也会在分界处画一条斜线。
其他例子:鸡尾酒聚会问题(麦克风分解不同音频)
**5. 其他**
答:终于干完了导师给的活,慢慢开始寒假了,这机器学习希望能在寒假结束时真正入门把==其实看视频课时听到诸如“特征”、“SVM”之类之前听过但觉得很遥远的再一看其实也就这么回事的专业术语时,还是很有意思的,学习不就是把所有专业术语搞懂并掌握的过程吗,仅此而已,加油好8,希望这不是我写的最认真的一个笔记。