目标:机器学习有意义;机器学习的应用;所有人有能力进行机器学习的研究。
预备知识:队、列、二叉树、线性代数
预备软件:Octave、Matlab
机器学习:1959年由Arthur提出:在不直接对对问题赋予计算机学习能力的一个领域。写一个下棋,和自己下棋,程序自己和自己下棋,学习怎样胜,怎样输。程序比人更会下棋。让机器自己学习。TOM1998,对于一个计算机,程序自己从中学习,经验E,任务T性能评价方法P。
四个部分:
1.监督学习
监督学习:假设手机一些房屋信息,某个地方房屋价格统计,房屋面积,房屋价格。提供了一组房屋大小,拟合乘直线或者二次曲线,能够根据房屋面积得到价格,与标准进行对比。回归是连续的。
分类问题,是离散的,一组乳腺肿瘤,找出恶性肿瘤。为了简单期间,只考虑肿瘤大小是恶性还是良性,所以值要么是0要么是1。这是一个分类问题,处理的是离散值,0或者1。0位良性,1为恶性。利用特性来看年龄和肿瘤大小变成一个监督学习的问题。其实也可以用到其他的一些属性如细胞大小,肿瘤厚度。现在我们的点可以在二维空间上,但是其实有很多位的,可以把数据映射到无限空间中,我们可以用到支持向量机。
2.理论工作
学习型算法
eg:读取邮编的算法。需要多少训练?需要多少算法?
3.无监督学习:不需要给出正确答案
比如:聚类问题对像素进行聚类,进行分组。对图像处理很有效。(分成不同区域,创建3D,amzing)
鸡尾酒会问题。聚会中收集到不同人说话的声音,能否把目标的声音分离出来。我们不知道正确答案,需要用无监督式的把它们的结构分离出来。或者扫描的EEG数据等。
ICA算法。 svd
4.强化学习:不需要进行一次决策的问题中
eg:在监督学习中预测是否是恶性肿瘤,决定生死,所以需要强化。
再如飞机的飞行,如果飞机摔下来,则用坏行为来区分,它慢慢的强化;训练一只狗,正确的获取奖励。