深度学习学习笔记(一)

深度学习入门(一)

序言

深度学习越来越重要。
深度学习的学习过程应当符合黑盒理念,框架性不断增强。
对于深度学习的学习需要:

  1. 思维技能
  2. 数学知识
  3. 软件工具

日常生活中的机器学习

机器学习的本质:收集巨大的数据集,确定一个最佳参数集,使得模型能够最好地完成任务。
在这里插入图片描述
训练过程流程图
训练的关键:

  • 数据
  • 模型
  • 目标函数
  • 算法

数据

数据由多个样本组成,样本,也称数据点/数据实例,在大多数情况下遵循独立同分布(完全随机)。每个样本有多个特征,机器学习根据特征预测一个标签,标签用来表示模型工作的结果。
特征聚合在一起形成特征向量,特征向量是有维度的。深度学习相比传统机器学习能够更好处理不同长度数据。
此外,数据的正确性也决定着模型的可靠性。

模型

深度学习通常维度更深,通常能够处理更加复杂的问题。

目标函数

目标函数,也被称为损失函数。可以定义模型的优劣程度,并且是可以优化的。
预测数值任务中,平方误差函数最为常见。即预测值和真实值之差的平方;解决分类问题任务中,最小化错误率函数最为常见。即预测与实际情况不符的样本比例。
通过训练数据集训练出一个模型,再放到新的数据集中测试效果,该数据集即为测试数据集。模拟考试考得好,真正考试有可能不行,那就出现了过拟合现象。

优化算法

优化算法搜索最佳参数,最小化损失函数。深度学习中,大多数流行优化算法通常基于梯度下降。即对参数进行少量变动,看会朝哪个方向下降,在减少损失的方向上优化参数。

常见机器学习问题

监督学习

训练数据是特征-标签,有真值。
在这里插入图片描述
监督学习过程
监督学习任务分类

回归

标签是一个数值,回归问题即数值预测问题。如预测房价。

分类

解决“哪一个”的问题,如手写数字识别,猫图鉴定器。
用“不确定性”的概念进行分类。分类问题常见的损失函数为交叉熵。

标记

学习预测不相排斥的类别问题,如动物分类,博客贴标签等。

搜索

对搜索的项目进行排序。例如可以分配相关性分数,检索评级最高的元素。

推荐系统

类似于搜索排名,给用户推荐电影,商品等工作中需要用到个性化推荐算法。

序列学习

如果数据的输入是连续的,模型就需要有“记忆”功能。典型的序列学习实例有:

  • 标记和解析 如解析一句话中哪个单词是命名实体。
  • 自动语音识别 解析说话内容。
  • 文本到语音 判断发音别扭的音频文件。
  • 机器翻译 文本对齐。

无监督学习

自发学习,获取很多数据,没有对结果进行要求。
大体分为如下例子:

  • 聚类问题 对照片主题分类。
  • 主成分分析 找到少量参数捕捉数据的线性相关属性。如用简单的参数描述人体形状。
  • 因果关系和概率图模型 发现不同数据之间的关系。
  • 生成对抗性网络 提供一种合成数据的方法。

与环境互动

在这里插入图片描述
从环境中为监督学习收集数据
监督学习,无监督学习首先要获得数据,再进行训练,与环境是分割开的,称为离线学习。如果希望人工智能与真实环境互动,影响环境,就需要与环境互动。

强化学习

智能体agent与环境environment交互,作出一些动作action,得到下一时刻的状态,并对其进行评分。获得一系列经验,存储到经验池中,下一次遇到类似的情况,优先选择评分最高的动作进行。
在这里插入图片描述
强化学习流程
分类:环境可被完全观察到时,强化学习问题为马尔可夫决策过程。状态不依赖于之前的操作时,问题称为上下文赌博机,没有状态,只有一组最初未知回报动作时,问题称为多臂赌博机。

起源

人类长期以来就有分析数据和预测未来的愿望。
统计学的发展,数据科学有着悠久的历史。
香农的信息论和图灵的计算理论,神经科学,心理学影响着机器学习。

深度学习之路

数据集的逐渐庞大以及算力提升让深度学习得以发展。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值