like alone-CSDN博客

原创 task04:注意力机制和Seq2seq模型

注意力机制不同的attetion layer的区别在于score函数的选择，在本节的其余部分，我们将讨论两个常用的注意层 Dot-product Attention 和 Multilayer Perceptron Attention；随后我们将实现一个引入attention的seq2seq模型并在英法翻译语料上进行训练与测试。import mathimport torch import...

2020-02-18 16:49:44 173

原创 Task04:机器翻译

机器翻译机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。import osos.listdir('/home/kesci/input/')import syssys.path.append('/home/kesci/input/d2l9528...

2020-02-18 16:19:18 102

原创 Task05:卷积神经网络基础+LeNet

卷积神经网络感受野LeNet架构卷积层互相关运算与卷积运算卷积层得名于卷积运算，但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组上下翻转、左右翻转，再与输入数组做互相关运算，这一过程就是卷积运算。由于卷积层的核数组是可学习的，所以使用互相关运算与使用卷积运算并无本质区别。填充步幅多输入通道和多输出通道卷积层的简洁实现X = torch.rand(4...

2020-02-18 15:59:32 103

原创 task03:循环神经网络进阶

门控循环神经网络RNN存在的问题：梯度较容易出现衰减或爆炸（BPTT）⻔控循环神经⽹络：捕捉时间序列中时间步距离较⼤的依赖关系GRU#参数初始化num_inputs, num_hiddens, num_outputs = vocab_size, 256, vocab_sizeprint('will use', device)def get_params(): def...

2020-02-17 11:19:37 98

原创 TASK03：梯度

梯度消失问题的解决方法1.ReLU函数2.深度残差网络3.批标准化陷入局部最小的解决方法1.深度信念网络预训练：寻找一个好的网络初始化2.Adma算法

2020-02-15 19:18:35 88

原创 TASK03：过拟合、欠拟合解决方案

模型选择、过拟合和欠拟合训练误差和泛化误差在解释上述现象之前，我们需要区分训练误差（training error）和泛化误差（generalization error）。通俗来讲，前者指模型在训练数据集上表现出的误差，后者指模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的误差来近似。多项式函数拟合实验%matplotlib inlineimport torchi...

2020-02-15 17:15:47 185

原创 2月14日学习内容2：循环神经网络

来源：伯禹学习平台普适逼近定理深度学习思想简介深度学习定义循环神经网络从零实现#数据读取import torchimport torch.nn as nnimport timeimport mathimport syssys.path.append("/home/kesci/input")import d2l_jay9460 as d2l(corpus_indices...

2020-02-14 19:06:23 128

原创 2月14日学习内容1：语言处理

内容来源：伯禹学习平台随机事件与概率随机事件1.随机试验特点：可在相同条件下重复进行，一次试验之前无法确定具体是哪种结果出现，但能确定所有的可能结果举例：掷一颗色子，可能出现不同的点数、抛一枚硬币，可能出现正面或者反面、一批电子产品中任意一个的使用寿命2.基础概念样本空间随机试验的所有可能结果所组成的集合称为样本空间，记为Ω样本点随机试验的单个结果或样本空间中的单个元素称为样本...

2020-02-14 17:25:36 136

原创 2月13日学习内容3 文本预处理

文本预处理文本是一类序列数据，一篇文章可以看作是字符或单词的序列，本节将介绍文本数据的常见预处理步骤，预处理通常包括四个步骤：读入文本分词建立字典，将每个词映射到一个唯一的索引（index）将文本从词的序列转换为索引的序列，方便输入模型import collectionsimport redef read_time_machine(): with open('/hom...

2020-02-13 19:15:49 157

原创 2月13日学习内容2：多层感知机

内容来源：伯禹学习平台反向传播算法西瓜书神经网络反向传播算法推导激活函数总结

2020-02-13 18:13:24 89

原创 2月13日学习内容1：softmax

逻辑回归首先，逻辑回归虽然名字里带回归，但其实是解决分类问题的！！！！！，尤其是二分类问题

2020-02-13 16:39:25 204

原创 2月12日内容3：线性回归python实现

从零实现import torchfrom Ipython import displayimport matplotlib.pyplot as pltimport numpy as npimport random#生成数据#torch.randn(*sizes, out=None) → Tensor#返回一个张量，从标准正态分布（均值为0，方差为1）中抽取的一组随机数。张量的形状由...

2020-02-12 20:22:35 93

原创 2月12日学习内容2：梯度下降

线性回归优化目标：最小化训练数据上的均方误差。

2020-02-12 17:59:17 93

原创 2-12日内容1：机器学习概述

什么是机器学习由 Tom Mitchel给出的更加数学化的定义：机器学习是一门硏究学习算法的学科，这些算法能够：在某些任务T上、通过经验E、提升性能P、非显式编程实现一个学习任务可以由三元组<T、P、E>明确定义两种机器学习类型面向预测根据数据预测所需的输出（监督学习）：给定数据和标签预测所需的输出，最理想的场景生成数据实例（无监督学习）：分析和利用隐式数据模式/结构...

2020-02-12 16:44:15 121

weixin_43343813的博客