一、机器学习概念
“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.”
E-T-P概念:
- E(experience): 就是之前的经验,即用于学习的数据
- T(task): 就是基于各种算法的训练过程
- P(probability): 就是对将来概率的预测
而且这是一个循环,首先基于experience进行算法分析和预测,然后用数据跑task,如果跑出来的结果和预期probability相符,则会继续提升自身的experience,然后继续…
二、监督学习与非监督学习
1、监督学习
在监督学习中, 我们的预测结果可以是连续值, 也可以是离散值. 我们根据这样的属性将监督学习氛围回归问题和分类问题。
监督学习:⎧⎩⎨⎪⎪回归(Regression)分类(Classification)
1.1 分类
数据本来具有确定的分类,机器学习结果是确定新输入的数据属于哪一种分类。
1.2 回归
数据不具备分类,机器学习结果将数据拟合成曲线,输入新数据对应新的数值。
2、非监督学习
在监督学习中我们也提到了它与无监督学习的区别. 在无监督学习中, 我们的数据并没有给出特定的标签, 例如上面例子中的房价或者是良性还是恶性. 我们目标也从预测某个值或者某个分类便成了寻找数据集中特殊的或者对我们来说有价值结构. 如下图所示, 我们可以直观的感受到监督学习和无监督学习在数据集上的区别。