吴恩达机器学习1.1-1.4笔记
机器学习主要算法
机器学习的定义有很多种,有一种形式化的定义是:针对所给的任务T,机器可以通过学习经验E,提高在T上的P,P是用来衡量(measure在T的表现(performance)的。听吴老师说,Octave是一款很好用的开源编程软件。硅谷很多大神都是先用Octave设计算法原型,如果可以运行,再用C++或者JAVA实现。
监督学习(Supervised Learning)
对于一部分数据集,有正确的答案。根据答案来调整算法。通常在描述中会有label(标签)字眼。
回归(Regression)
通常是需要预测连续的值,比如通过已知的(房子面积,房价)来通过房子面积来预测房价。在这里,已经收集到一部分已知的数据,已知房子面积和房价。房价可以看成是连续的值,实数。
分类(Classfication)
通常是预测离散的值。通过一些已有的数据的1个或若干个特征之间的相互关系来预测其中一个或若干个特征。比如患癌症人的年龄,肿瘤良性或者阴性,肿瘤快的大小。可以通过已知的病人数据来进行预测新的肿瘤患者的肿瘤性质。
单特征预测
无监督学习(UnSupervised Lesrning)
聚类(Cluster)
比如在二维平面上有许多点,需要把它们分成几类。此时并没有已知标签让人可以知道某一个点是什么类别。
鸡尾酒会算法(Cocktail Party Algorithm)
在一个party上,有两个麦克风,两个麦克风有人同时讲话,那么它们发出来的声音就会有重叠的部分。把两个麦克风的声音都录下来,如何将它们重叠的部分剔除,把麦克风的录音只保留对着它讲的人的声音。