人工智能与机器学习
(一)人工智能
- 人工智能的定义
只要能让计算机模拟人类行为的技术,就称作是人工智能
在我们生活中 ,有很多对未来世界的假设,有很多关于人工智能的电影
2. 人工智能的分类领域
1) 模式识别
2) 图像识别
图像识别应用的领域:
自动驾驶——> 深度神经网络,图像识别,模式识别
图像识别/图像处理
工业自动化 ——> 机器学习/图像识别
光学影像 ——> 深度学习/模式识别
3) 语音识别
语音识别应用领域:
个人助手——> 深度学习
自动话务员——> 深度识别/模式识别
声纹识别 ——> 深度学习/LSTM
4) 自然语言处理
NLP应用领域:
(大)数据分析——> 大数据(深度学习)
文本分析——> 模式识别/NLP/LSMT
人工智能与机器学习
机器学习是现阶段人工智能的核心技术,是通过统计学原理,来对数据进行分析和建模
模式识别 = 机器学习
数据挖掘 = 机器学习 + 数据库
统计学习近似等于机器学习
机器视觉 = 图像处理 + 机器学习
语音识别 = 语言处理 + 机器学习
自然语言处理 = 文本处理 + 机器学习
(二)机器学习
-
机器学习的基本方法 -------数据训练
-
机器学习的基本思想: 通过大量的数据学习,找到一定规律(这个规律称作是模型),当有新的数据出现时,再将新的数据带入模型
优点:
1) 速度快
2) 高度抽象,简单易学
缺点:
1) 极度依赖数据
2) 模型的好坏至关重要
现阶段的主流基于统计的人工智能算法,是通过大量的案例,靠对数据的特征进行归类,来实现识别的效果。这个做法称作是 ”罗素鸡“
那么,如何克服呢?
-----采用深度学习和强化学习
普通机器学习: 一个公式, 一层推导,比较直接
深度学习与普通的机器学习的区别: 通过更高的复杂度,加强了让机器自我归纳总结的能力,并且通过规则的设计,让算法的扩展性更大
强化学习与普通的机器学习区别: 强化学习模拟人的认知过程,加入了评价系统 -
机器学习的基本步骤
机器学习系统的分类:
- 根据训练期间接受的 监督数量和监督类型分为: 监督式,无监督式,半监督式学习和强化学习
1)监督式: 提供给算法的包含所需解决方案的训练数据,称为标签或者标记
(监督式学习的算法: K-近邻算法,线性回归,逻辑回归,支持向量机,决策树和随机森林,神经网络)
2)无监督式学习: 无监督式学习的训练数据都是未经标记地的。系统会在没有老师的情况下进行学习。(无监督式学习算法: 聚类算法,K-平均算法,分层聚类分析,最大期望算法)
3)半监督式学习: 通常是大量未标记的数据和少量标记的数据。(大多数半监督式学习算法是无监督式和监督式算法的结合。 eg : 深度信念网络)
4)强化学习: 强化学习的学习系统(在其语言境中称作是智能体)能够观察环境,做出选择,执行操作,并且获得回报(reward),或者是以负面回报的形式获得惩罚,所以它自己必须自行学习什么是最好的策略,从而随着时间推移获得最大的回报
- 根据系统是否可以从传入的数据流中进行增量学习可以分为: 批量学习和在线学习
1)批量学习: 系统无法进行增量学习—— 必须要通过所有可用的数据进行训练。这需要大量的时间和计算资源。所以通常都是离线完成的。
2)在线学习: 可以循序渐进地给系统提供训练数据,逐步积累学习成果。这种提供数据的方式可以是单独的,也可以采用小批量(mini-batch)的小组数据进行训练。
- 根据机器学习系统如何泛化可以分为:基于实例和基于模型的学习
1)基于实例的学习
系统先完全记住学习示例,然后通过某种相似度度量方式将其泛化到新的实例
2)基于模型的学习
系统先构建这些示例的模型,然后使用该模型进行预测