- 最常见的两种机器学习算法
- Supervised learning
> 给算法一个数据集,其中包含 the right answer,即带有标签。算法的目的进行预测,给出更多的正确答案
> 包括回归问题(regression problem)(eg房价预测,设法预测一个连续值输出)
分类问题(Classification,设法预测一个离散值输出,eg预测肿瘤是良性or恶性)
- Unsupervised learning
> 给算法一个数据集,不带任何标签,试从中找到某种结构。
> 包括聚类算法clustering
(1)应用在基因组学中,在DNA微阵列数据,给定一组不同个体,对于每个个体检测他们是否拥有某个特定的基因,也就是检测基因的表达程度,从而根据它将个体归为不同的类or不同类型的人。
(2)应用在大型的计算机集群,哪些机器趋向于协同工作,从而把它们放在一起,让集群更高效。
(3)社交网络的分析
(4)市场细分
2.其他机器学习算法
Reinforcement learning,recommender systerms
3.学会算法并且要学会如何用这些算法