监督学习:
supervised learning (given the "right answer" for each example in the data
)
监督学习是指数据集中,有部分数据是已经含有正确答案,即为训练集,根据该类数据集去算出另一部分数据集的答案。
监督学习主要分为有两大类问题:
- 回归 虽然给的数据集可能是离散的,但是一般会理解为连续值(predict real-valued output,预测一个准确的输出值)
- 分类 例如,预测肿瘤是良性的还是恶性(给出一些已知是良性或恶性肿瘤的数据)
回归问题:分为线性回归(linear regression)和非线性回归:
通常是: 给定training set(训练集)
————>进行learning algorithm
————>得到(输入x——>hypothesis/函数——>输出y),即x映射到y的函数
无监督学习:
unsupervised learning
无监督学习是指数据集都是没有已知答案的。
常用有:
聚类
奇异值分解(svd):eg:将重叠的音频分离~