CS229学习笔记系列
目录
一、监督学习
(x,y)x是输入值,y是标签,就是要找到输入和标签的映射关系。这样之后再给出一个x可以找到相对应的y。
例子:
横轴是房子的面积,纵轴是房价。(回归问题)输出是连续的
横轴是肿瘤直径,纵轴是是否恶性。(分类问题)
事实上很多时候输入是高维的,比如下面是年龄和大小。
支持向量机,有无穷维数的向量来表示无限的向量。
二、无监督学习
没有标签的数据集,只有输入x没有y。kmeans
例如:
谷歌新闻,可以将不同主体的新闻弄起来。遗传数据,将人类分为不同类型。市场画像。鸡尾酒问题,很多麦克风放在很多人的房间,如何将人分离出来。
三、强化学习
像训练狗一样,做得好的鼓励,不好的排斥,逐渐让他做的更好。