终于要开始踏入我梦寐以求的人工智能的大门,希望不会是从入门到放弃。。。。。。干巴爹。。。。
文章目录
一、导论
1、机器学习和人工智能
人工智能:用计算机来实现人类的智能 例如,去模仿人类的知觉、推理、学习能力等,从而让计算机能够像人一样思考和行动 。
机器学习:其实是人工智能很重要的一部分,因为目前,在实践过程中,大多数的人工智能处理的任务,其实是用机器学习的方式完成的。
简单的说,机器学习是人工智能的子集。
机器学习是现阶段人工智能的核心技术,是通过统计学原理,来对数据进行分析与建模
2、人工智能的分类领域
模式识别,图像识别,语言识别,自然语言处理(NLP)
图像识别应用领域:
(1)自动驾驶 ----> 深度神经网络 / 图像识别 / 模式识别
(2)图像识别 / 图像处理 ----> 深度神经网络/ LSTM
(3)工业自动化 ----> 机器学习 / 图像识别
(4)光学影像 ----> 深度学习 / 模式识别
等等
NLP应用领域:
(1)数据分析 ----> 大数据(Hadoop / Spark / MR, 深度学习 / LSTM, NLP)
(2)文本分析 ----> 模式识别 / NLP / LSTM
等等
语音识别应用领域:
(1)个人助手 -----> 深度学习
(2)自动话务员 -> 深度学习/模式识别/LSTM
(3)声纹识别 -> 深度学习/LSTM
等等
3、机器学习的基本方法
逻辑推理和数据训练
机器学习的基本思想是通过大量数据的学习,找到一定的规律(这个规律就叫做模型),当有新数据出现时,把新数据带入模型。
优点:
(1)速度快
(2)高度抽象化,简单易用
缺点:
(1)极度依赖数据
(2)模型的好坏至关重要
4、机器学习的难点
(1)不是在根据逻辑判断,是依靠数据,所以会从在一些小的逻辑错误
当你对你的Siri说: “推荐附近的餐厅不要日本菜” 它可能只是提取出了 “附近” ,“餐厅” , “日本菜”, 所以并没有给出我们想要的答案。
(2)罗素鸡
现阶段的主流的基于统计的人工智能算法,是通过大量的案例,靠对数据的特征进行归类,来实现识别效果。
如果你没有选用合适的特征范围对数据进行分析,可能会出现偏差。
如何克服这个问题:
深度学习和强化学习
深度学习和普通机器学习的区别:通过更高的复杂度,加强了让机器自我归纳总结的能力,并且通过规则的设计,让算法的扩展性更大
普通机器学习算法:一般就一个公式,一层推导,比较直接
深度学习算法:多个公式,多层推导,层层递进
强化学习和普通机器学习的区别:强化学习模拟人的认知过程,加入评价体系
(3)有些情况是要在特定的环境下,或者是需要人们的一些常识来做出判断的。
比如我们说:
“四川火锅比日料更好,因为它很辣”
“四川火锅比日料更好,因为它不辣”
我们可以跟明确的指出其中的 “它” 分别指谁
但是如果直接说
“A比B更好,因为它很辣”
我们并不能清楚的知道这里的原因
5、机器学习的基本步骤
6、机器学习需要涉及的数学知识
高等数学
线性代数
概率论与数理统计
(考研数一的童鞋疯狂点头。。。。。)
不过不要怕,不是整本书,部分章节
什么高斯分布函数,导数,矩阵等等。。。。
二、几个基本概念
1、简单的机器学习流程
我们主要用的还是第二个
2、训练集,验证集(开发集),测试集
在机器学习和模式识别等领域中,一般需要将样本分成独立的三部分:
训练集(train set),验证集(validation set ) 和测试集(test set)。
其中训练集用来估计模型,
验证集用来调整参数,
测试集用来测试模型准确度
3、常见的机器学习算法
scikit - learn 库
分类, 回归, 聚类, 降维, 模型选择, 预处理
4、有监督机器学习,无监督机器学习
有监督机器学习:我们要教会计算机做某些事情
我们给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案。
就是给出了x, y的值
举例: 分类
无监督机器学习:让计算机自己去做某些事情
我们给算法一个数据集,但是不给他正确答案,而让计算机自己去学习
就是只给出了x 值
举例: 聚类