A. 深度学习 --- 概述

A. 深度学习 — 概述

概述

  • 理论基础
    • 神经生理学
      • 思维过程是神经元的连接活动过程,由大量突触相互动态联系着的众多神经元协同作用来实现;
      • 大脑的思维源于从神经元到神经网络再到神经回路的功能逐级整合;
      • 大脑对信息的加工可以理解为复杂的多次特征提取过程;
      • 在大脑中,数据的传输和处理是同步进行的。
    • 认知科学
  • 历史
    • 神经活动中思想内在性的逻辑演算:神经元的表示
    • 赫布理论:神经元连接权重的变化规则
    • 1958年:感知器(perceptron)”模型:学习问题 — 解决线性分类
    • 1969年:感知器:计算几何简介
    • 1969年:Perceptron has limitation
    • 1980年:多层感知器(Multi-layer perceptron),求导的链式法则
      • 跟现在的DNN没有本质的区别
    • 1986年:Backpropagation
      • 一般超过3层没有什么效果
    • 1989年:1 hidden layer is “good enough”,why deep?
    • 2006年:RBM(Restricted Boltzmann Machine) initialization(breakthrouth)
    • 2009年:GPU加速
    • 2011年:start to be popular in speech recognition
    • 2012年:win ILSVRC image competition
  • 神经网络类型
    • 每个向量对应一个标签
      • 词性标注
      • 语音识别
    • 一整个Sequence对应一个标签
      • 情感分析
    • 不定长输入、不定长输出
      • 机器翻译
  • 现阶段模型大小
    • ELMO - 94M
    • BERT - 340M
    • GPT-2 - 1542M
    • Megatron - 8B
    • T5 - 11B
    • Turing NLG - 17B
    • GPT-3 - 175B
    • Switch Transformer - 1.6T

神经网络分类

  • 前馈神经网络
    • 反向传播神经网络
    • 径向基神经网络
      • 训练步骤
        • 第一步,确定神经元中心,常用的方式包括随机采样、聚类等;
          • 第一步的任务是初始化中心向量Wi 的位置,中心向量的位置既可以随机分配,也可以通过这一无监督学习的方法完成。这个步骤对应的是隐藏层的训练。
          • 第二步的任务是用线性模型拟合初始化的隐藏层中的各个中心向量,拟合的损失函数设定为最小均方误差函数,使用递归最小二乘法(Recursive Least Square)使损失函数最小化。这个步骤对应的是对输出层的训练。
        • 第二步,利用BP算法等来确定参数。
      • 与BP的区别
        • 局部逼近与全局逼近:径向基是局部逼近,BP是全局逼近
        • 隐藏层数的区别:径向基是单层隐藏层,BP是多层隐藏层
        • 训练速度的区别:径向基训练速度快,隐藏层少
        • Poggio和Girosi已经证明,RBF网络是连续函数的最佳逼近,而BP网络不是
  • 递归神经网络
    • 时间递归神经网络
      • LSTM
    • 结构递归神经网络
  • 反馈神经网络
  • 无监督的神经网络
    • 自组织适应神经网络
      • 步骤
        • 使用主成分法或随机法初始化神经元的权重系数;
        • 选取训练集中的样本用于激活整个网络;
        • 根据最小距离准则寻找最佳匹配神经元;
        • 通过更新方程调整所有神经元的权重系数;
        • 重复以上步骤直到在从输入模式到神经元的映射关系中观察不到明显变化。
  • 模糊神经网络
    • 基于水平集的方法
    • 基于遗传算法的方法
  • 深度强化学习:深度学习和强化学习
    • 分类
      • 基于价值
      • 基于策略
      • 基于模型

深度学习

  • 概述
    • 前提
      • 数据的井喷
      • 计算机的飙升
    • 假设
      • 待学习的复杂函数可以视为若干简单函数的层次化结合
    • 优势
      • 使用深度架构的模型既能减少表示目标函数时所需要的单元数量,也能有效降低泛化误差,在一定程度上抑制过拟合的发生。
    • 面临的问题
      • 连接方式:全连接、稀疏链接
      • 损失函数
  • 正则化
    • 基于数据的正则化
    • 基于网络架构的正则化
      • 参数共享(weight sharing)是一类重用参数的正则化方法
      • 另一种针对网络架构的处理是对传递函数的正则化(activation regularization)
    • 基于误差函数的正则化
    • 基于正则化项的正则化
    • 基于最优化过程的正则化
      • 对初始化(initialization)的正则化
      • 对参数更新(weight update)的正则化
      • 对终止条件(termination)的正则化
  • 优化
    • 问题
      • 病态矩阵:当系数矩阵 A 的微小扰动会给解集 x 带来较大幅度的波动
      • 深度神经网络面临的另一个挑战是局部极小值的问题。
      • 鞍点:鞍点是梯度为 0 的临界点,但它既不是极大值也不是极小值。
    • 算法
      • 随机梯度下降法
        • 随机降低噪声
          • 动态采样
          • 梯度聚合
          • 迭代平均
        • 二阶导数近似:通过使用二阶导数近似的信息来抑制高度非线性和病态目标函数的不利影响。
          • 牛顿法
          • 高斯牛顿法
          • 无 Hessian 牛顿法
        • 动量法
        • 加速下降方法
        • 坐标下降方法

深度学习框架

  • 深度信念网络模型
  • 卷积神经网络
    • 性质
      • 稀疏感知性
      • 参数共享性
      • 平移不变性
    • 结构
      • 卷积层
      • 激活层
      • 池化层
      • 全连接层
  • 循环神经网络
    • 递归神经网络
  • 生成式对抗网络
    • 问题
      • 缺乏理论基础
      • 训练难
  • 长短期记忆网络
    • 组成部分
      • 记忆模块
      • 输入门
      • 输出门
      • 遗忘门
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
从零开始学习人工智能,以下是一些建议和步骤: 1. 入门阶段:首先,你可以选择阅读一些经典的人工智能教材,比如《Artificial Intelligence: A Modern Approach (AIMA)》\[2\]。这本书提供了人工智能领域的概述和基本概念的解释。 2. 学习Python:学习机器学习的基础是掌握Python编程语言。Python在机器学习领域被广泛使用,因为它提供了很多便利和高效的工具库。你可以通过在线教程或者参加课程来学习Python。 3. 数据处理:在学习机器学习之前,建议先学习数据处理的算法库,如NumPy和Pandas。这两个库对于数据整理和处理非常重要,掌握它们可以帮助你更好地理解和处理数据。 4. 学习传统机器学习算法:在掌握Python和数据处理之后,你可以开始学习传统的机器学习算法。这些算法包括线性回归、多项式拟合、最小二乘法拟合、分类、聚类、决策树、随机森林、支持向量机、朴素贝叶斯等等。理解这些算法的原理对于后续学习深度学习非常重要。 5. 深度学习:一旦你掌握了传统机器学习算法,你可以开始学习深度学习。深度学习是人工智能领域的热门技术,它使用神经网络模型来解决复杂的问题。你可以学习深度学习的基本原理、常用的深度学习框架(如TensorFlow、PyTorch)以及一些常见的深度学习模型(如卷积神经网络、循环神经网络)。 总结起来,从零开始学习人工智能需要掌握Python编程语言、数据处理算法库、传统机器学习算法和深度学习。这个过程需要耐心和持续的学习,同时也可以参加一些在线课程或者参考相关的书籍和教材来加深理解。希望这些建议对你有所帮助!\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* *3* [如何从零开始学习人工智能](https://blog.csdn.net/weixin_45081640/article/details/117453685)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [初学者如何从零开始学习人工智能?看完你就懂了](https://blog.csdn.net/sd19871122/article/details/60955281)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值