1 机器学习概述
1. 什么是机器学习?
机器学习其实是用数据回答问题,可理解为使用数据,回答问题。
使用数据是指训练系统,回答问题是指依据训练的系统做出预测与分类。训练是指使用数据了解用户习惯,并不断完善预测模型,而预测模型则可以对未知的数据进行预测并回答一系列问题。
数据越多,模型则会被训练的越好,预测的结果越准确,所以在机器学习中最重要的就是数据,不管是机器学习还是大数据,所有的内容均与数据息息相关。数据并不局限于数字,还包括文本,图像,视频等。
简单来说,机器学习就是从历史数据中学习规律,然后将规律应用到未来中。
2. 机器学习流程
假如我们正在教小朋友识字(一、二、三)。我们首先会拿出3张卡片,然后便让小朋友看卡片,一边说“一条横线的是一、两条横线的是二、三条横线的是三”。不断重复这个过程,小朋友的大脑就在不停的学习。当重复的次数足够多时,小朋友就学会了一个新技能——认识汉字:一、二、三。
我们用上面人类的学习过程来类比机器学习。机器学习跟上面提到的人类学习过程很相似。
- 认字的卡片在机器学习中叫——训练集
- “一条横线,两条横线”这种区分不同汉字的属性叫——特征
- 小朋友不断学习的过程叫——建模
- 学会了识字后总结出来的规律叫——模型
通过训练集,不断识别特征,不断建模,最后形成有效的模型,这个过程就叫“机器学习”
3. 机器学习发展历程
机器学习的起源应该追溯到17世纪,贝叶斯,拉普拉斯关于最小二乘法的推导和马尔科夫链构成了机器学习被广泛使用的工具和基础,从1950年(艾伦.图灵提出建立学习机器)到2000年初(深度学习的广泛应用),机器学习