深度学习入门(一)
序言
深度学习越来越重要。
深度学习的学习过程应当符合黑盒理念,框架性不断增强。
对于深度学习的学习需要:
- 思维技能
- 数学知识
- 软件工具
日常生活中的机器学习
机器学习的本质:收集巨大的数据集,确定一个最佳参数集,使得模型能够最好地完成任务。
训练过程流程图
训练的关键:
- 数据
- 模型
- 目标函数
- 算法
数据
数据由多个样本组成,样本,也称数据点/数据实例,在大多数情况下遵循独立同分布(完全随机)。每个样本有多个特征,机器学习根据特征预测一个标签,标签用来表示模型工作的结果。
特征聚合在一起形成特征向量,特征向量是有维度的。深度学习相比传统机器学习能够更好处理不同长度数据。
此外,数据的正确性也决定着模型的可靠性。
模型
深度学习通常维度更深,通常能够处理更加复杂的问题。
目标函数
目标函数,也被称为损失函数。可以定义模型的优劣程度,并且是可以优化的。
预测数值任务中,平方误差函数最为常见。即预测值和真实值之差的平方;解决分类问题任务中,最小化错误率函数最为常见。即预测与实际情况不符的样本比例。
通过训练数据集训练出一个模型,再放到新的数据集中测试效果,该数据集即为测试数据集。模拟考试考得好,真正考试有可能不行,那就出现了过拟合现象。
优化算法
优化算法搜索最佳参数,最小化损失函数。深度学习中,大多数流行优化算法通常基于梯度下降。即对参数进行少量变动,看会朝哪个方向下降,在减少损失的方向上优化参数。
常见机器学习问题
监督学习
训练数据是特征-标签,有真值。
监督学习过程
监督学习任务分类
回归
标签是一个数值,回归问题即数值预测问题。如预测房价。
分类
解决“哪一个”的问题,如手写数字识别,猫图鉴定器。
用“不确定性”的概念进行分类。分类问题常见的损失函数为交叉熵。
标记
学习预测不相排斥的类别问题,如动物分类,博客贴标签等。
搜索
对搜索的项目进行排序。例如可以分配相关性分数,检索评级最高的元素。
推荐系统
类似于搜索排名,给用户推荐电影,商品等工作中需要用到个性化推荐算法。
序列学习
如果数据的输入是连续的,模型就需要有“记忆”功能。典型的序列学习实例有:
- 标记和解析 如解析一句话中哪个单词是命名实体。
- 自动语音识别 解析说话内容。
- 文本到语音 判断发音别扭的音频文件。
- 机器翻译 文本对齐。
无监督学习
自发学习,获取很多数据,没有对结果进行要求。
大体分为如下例子:
- 聚类问题 对照片主题分类。
- 主成分分析 找到少量参数捕捉数据的线性相关属性。如用简单的参数描述人体形状。
- 因果关系和概率图模型 发现不同数据之间的关系。
- 生成对抗性网络 提供一种合成数据的方法。
与环境互动
从环境中为监督学习收集数据
监督学习,无监督学习首先要获得数据,再进行训练,与环境是分割开的,称为离线学习。如果希望人工智能与真实环境互动,影响环境,就需要与环境互动。
强化学习
智能体agent与环境environment交互,作出一些动作action,得到下一时刻的状态,并对其进行评分。获得一系列经验,存储到经验池中,下一次遇到类似的情况,优先选择评分最高的动作进行。
强化学习流程
分类:环境可被完全观察到时,强化学习问题为马尔可夫决策过程。状态不依赖于之前的操作时,问题称为上下文赌博机,没有状态,只有一组最初未知回报动作时,问题称为多臂赌博机。
起源
人类长期以来就有分析数据和预测未来的愿望。
统计学的发展,数据科学有着悠久的历史。
香农的信息论和图灵的计算理论,神经科学,心理学影响着机器学习。
深度学习之路
数据集的逐渐庞大以及算力提升让深度学习得以发展。