机器学习现在太火热了,太多人在学,我也跟风在学,一次偶然机会了解到优达学城,本文作为课程的总结。
1.机器学习
1.1机器学习的定义
维基百科中机器学习有下面几种定义:
- 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
- 机器学习是对能通过经验自动改进的计算机算法的研究。
- 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
上面的定义似乎很绕口,如果不了解机器学习的话根本不知道他在说啥,借用一下别人的图,比较搞笑:
当然也能反映出一些问题,机器学习就是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。其中重要的模型就是在别人看来很高大上的数学公式,当然,这些数学公式不需要我们这些菜鸟去发明创造,我们只要能够理解和应用它们。
1.2 机器学习中的术语
数据集:训练机器学习模型所用到的数据,比如一个学校的学生数据(年龄,父亲身高,母亲身高,性别,身高)
特征:数据集中每个学生的某项数据,年龄,性别等。。我们要做的是用前面的特征预测后面的身高
训练集:
验证集:
测试集:
2.模型评估与验证
3.监督学习
4.非监督学习