- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 机器翻译基础知识
机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。主要步骤 有 数据清洗,分词 ,建立字典(即数字化),Encoder-Decoder注意力机制在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量(context...
2020-02-18 21:44:59 876
原创 过拟合/欠拟合,梯度消失和爆炸概念
在解释过拟合/欠拟合之前,我们需要区分训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型在任意一个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。计算训练误差和泛化误差可以使用之前介绍过的损失函数,例如线性回归用到的平方损失函数和softmax回归用到的交叉熵损失函数。...
2020-02-18 21:33:02 397
原创 卷积神经网络基础知识
通常在图像处理这种连续值的时候采用卷积神经网络,其中包括卷积层和池化层,卷积核的尺寸通常小于输入数组,卷积核在输入数组上滑动,在每个位置上,卷积核与该位置处的输入子数组按元素相乘并求和,得到输出数组中相应位置的元素互相关运算与卷积运算卷积层得名于卷积运算,但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组上下翻转、左右翻转,再与输入数组做互相关运算,这一过程就是卷积运算。由于卷积...
2020-02-18 21:26:33 313
原创 英文文本预处理
这里主要讲解下英语词语处理的过程。(参考伯禹教育课程)读入文本 分词 建立字典,将每个词映射到一个唯一的索引(index) 将文本从词的序列转换为索引的序列,方便输入模型根据停用词 词频 TF-IDF等方法计算每个英文的词频。然后建立词语与索引的映射。import collectionsimport redef read_time_machine(): with ...
2020-02-14 21:02:06 580
原创 基于Pytorch的实现代码- 线性回归
线性回归主要内容包括:线性回归的基本要素 线性回归模型从零开始的实现 线性回归模型使用pytorch的简洁实模型模型为预测房价 有两个因素,即面积(平方米)和房龄(年) 我们的目标是为了找到一个拟合函数与真实值逼近。2、损失函数在模型训练中,我们需要衡量价格预测值与真实值之间的误差。通常我们会选取...
2020-02-14 20:26:57 343
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人