![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
渣渣菜
渣渣之旅
展开
-
深度学习(五)————卷积神经网络基础、leNet、卷积神经网络进阶
卷积神经网络基础本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义我们介绍卷积层的两个超参数,即填充和步幅,它们可以对给定形状的输入和卷积核改变输出形状。二维互相关运算二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(...原创 2020-02-19 20:51:29 · 415 阅读 · 0 评论 -
深度学习(四)————机器翻译及相关技术、注意力机制与Seq2seq模型、Transformer
目录机器翻译及相关技术注意力机制与seq2seq模型Transformer机器翻译及相关技术机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。机器翻译流程:数据预处理,主要模型:encode-decode,seq2seq...原创 2020-02-18 16:34:31 · 345 阅读 · 0 评论 -
深度学习(三)————过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶
目录过拟合、欠拟合及其解决方案训练误差和泛化误差过拟合和欠拟合的概念模型复杂度和误差之间的关系解决过拟合的方案梯度消失及梯度爆炸循环神经网络进阶GRULSTM深度神经网络过拟合、欠拟合及其解决方案训练误差和泛化误差 在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization err...原创 2020-02-18 15:34:08 · 379 阅读 · 0 评论 -
深度学习(二)————文本预处理、语言模型、循环神经网络基础
目录文本预处理语言模型n-gram语言模型神经网络语言模型循环神经网络基础简介计算过程文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型常用文本预处理pytho...原创 2020-02-14 20:12:06 · 273 阅读 · 0 评论 -
深度学习(一)————线性回归、Softmax、多层感知机
目录线性回归模型Softmax多层感知机公式表达激活函数线性回归模型 为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系:损失函数在模型训练中,我们需要衡量价格预测值与真实值之间的误差。通常我们会选下列公式为损失误差...原创 2020-02-14 16:57:14 · 203 阅读 · 0 评论 -
想成为深度学习的高手必须要懂哪些知识?
转http://www.elecfans.com/rengongzhineng/603994.html深度学习本质上是深层的人工神经网络,它不是一项孤立的技术,而是数学、统计机器学习、计算机科学和人工神经网络等多个领域的综合。深度学习的理解,离不开本科数学中最为基础的数学分析(高等数学)、线性代数、概率论和凸优化;深度学习技术的掌握,更离不开以编程为核心的动手实践。没有扎实的数学和计算机...转载 2019-07-02 09:47:39 · 367 阅读 · 0 评论