目录
人工智能三大概念
人工智能AI
Artificial Intelligence 人工智能
-
AI is the field that studies the synthesis and analysis of computational agents that act intelligently
-
AI is to use computers to analog and instead of human brain
-
释义 - 仿智; 像人一样机器智能的综合与分析;机器模拟代替人类
-
释义:是一个系统,像人那样思考 像人那样理性思考
-
释义:是一个系统,像人那样活动 像人那样合理系统
机器学习ML
Machine Learning 机器学习
- Field of study that gives computers the ability to learn without being explicitly programmed
- 释义:让机器自动学习,而不是基于规则的编程(不依赖特定规则编程)
-
人类识别车:根据车的特征归纳出车的规律;来了一个新的图片,判断预测是否是车
-
机器学习识别车: 从数据中获取规律;来了一个新的数据,产生一个新的预测
深度学习DL
Deep Learning 深度学习
- 深度神经网络,大脑仿生,设计一层一层的神经元模拟万事万物
三者之间的关系
- 机器学习是实现人工智能的一种途径
- 深度学习是机器学习的一种方法
学习方式
基于规则的学习
- 基于规则的预测 : 程序员根据经验利用手工的if-else方式进行预测
- 但是有好多问题, 无法明确的写下规则,此时我们无法使用规则学习的方式来解决这一类问题,比如:
-
图像和语音识别
-
自然语言处理
基于模型的学习
- 基于模型的学习就是通过编写机器学习算法,让机器自己学习从历史数据中获得经验、训练模型:
机器学习发展三要素
- 数据、算法、算力三要素相互作用,是AI发展的基石
数据
作用
- 决定了模型效果的上限
常见术语
样本
一条数据就是一个样本
特征
一列数据一个特征,有时也被称为属性
特征是从数据中抽取出来的对结果预料有用的信息(属性)
标签![](https://img-blog.csdnimg.cn/direct/f8a859c2f2c84197a80f088aecb358d4.png)
需要预测的信息
数据集划分
数据集可划分两部分:训练集、测试集 比例:8 : 2,7 : 3
训练集(training set):用来训练模型(model)的数据集
测试集(testing set):用来测试模型的数据集
算力
1. CPU:负责调度任务、计算任务等;主要适合I\O密集型的任务
2. GPU:更加适合矩阵运算;主要适合计算密集型任务
3. TPU:Tensor,专门针对神经网络训练设计一款处理器
算法
有监督学习
定义:输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的
数据集:需要人工标注数据
分类:
- 目标值(标签值)是不连续的
- 分类种类:二分类、多分类任务
回归:
目标值(标签值)是连续的
无监督学习
定义:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部 结构及相互关系。
数据集:不需要标注数据
无监督学习特点:
1 训练数据无标签
2 根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系
半监督学习
工作原理:
1 让专家标注少量数据,利用已经标记的数据(也就是带有类标签)训练出一个模型
2 再利用该模型去套用未标记的数据
3 通过询问领域专家分类结果与模型分类结果做对比,从而对模型做进一步改善和提高
半监督学习方式可大幅降低标记成本
强化学习
强化学习(Reinforcement Learning):机器学习的一个重要分支
应用场景:
里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景
基本原理:
通过构建四个要素:agent,环境状态,行动,奖励,agent根据环境状态进行行动获得最多的累计奖励。
示例:
小孩子学走路:
(1) 小孩就是 agent,他试图通过采取行(即行走)来操纵环境(地面)
(2) 并且从一个状态转变到另一个状态(即他走的每一步)
(3) 当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃)
(4) 并且当他不能走路时,就不会给巧克力。
总结