监督学习:给定数据集样本,能给出准确的结果。
可以理解为待预测的可以被模型明确地训练出来(有充分训练样本)
分类问题:离散的结果,breast cancer
回归问题:数据多,可当实数 house price predict
无监督学习:所有数据一样,没有属性或者标签,只有数据,但数据怎么样,什么意思不知道,怎么找到其中的关系?算法自己去数据中去发现蕴含的某种规律
聚类算法:url链接,web新闻类似的内容会在一起——新闻专题,自动聚合在一起;
在基因学里,通过人的基因进行分类,不知道谁是谁
鸡尾酒宴会算法:不同人声音和不同麦克风:分离和叠加
Octave