- 博客(13)
- 收藏
- 关注
原创 《动手学深度学习PyTorch版》打卡_Task6,批量归一化和残差网络
批量归一化(BatchNormalization)对输入的标准化(浅层模型)处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。标准化处理输入数据使各个特征的分布相近批量归一化(深度模型)利用小批量上的均值和标准差,不断调整神经网络中间输出,从而使整个神经网络在各层的中间输出的数值更稳定。神经网络学习过程本质上就是为了学习数据分布,如果训练数据与测试数据的分布不同...
2020-02-25 16:46:57 264
原创 《动手学深度学习PyTorch版》打卡_Task8,文本分类,数据增强,模型微调
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,对文本分类,数据增强,模型微调做下笔记。文本情感分类文本分类是自然语言处理的一个常见任务,它把一段不定长的文本序列变换为文本的类别。本节关注它的一个子问题:使用文本情感分类来分析文本作者的情绪。这个问题也叫情感分析,并有着广泛的应用。同搜索近义词和类比词一样,文本分类也属于词嵌入的下游...
2020-02-25 16:16:09 469
转载 《动手学深度学习PyTorch版》打卡_Task7,word2vec,词嵌入进阶
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,对word2vec,词嵌入进阶做下笔记。词嵌入基础one-hot 词向量无法准确表达不同词之间的相似度,如我们常常使用的余弦相似度,Word2Vec 词嵌入工具的提出正是为了解决上面这个问题,它将每个词表示成一个定长的向量,并通过在语料库上的预训练使得这些向量能较好地表达不同词之间的相似和类...
2020-02-25 13:39:08 245
转载 《动手学深度学习PyTorch版》打卡_Task5,卷积神经网络基础,LeNet,卷积神经网络进阶
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,卷积神经网络基础,LeNet,卷积神经网络进阶。神经网络中所说的卷积计算其实是互相关运算,一直以来理解有偏差。互相关运算与卷积运算卷积层得名于卷积运算,但卷积层中用到的并非卷积运算而是互相关运算。我们将核数组上下翻转、左右翻转,再与输入数组做互相关运算,这一过程就是卷积运算。由于卷积层...
2020-02-19 15:56:31 227
原创 《动手学深度学习PyTorch版》打卡_Task4,机器翻译及相关技术,注意力机制与Seq2seq模型
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,机器翻译及相关技术,注意力机制与Seq2seq模型做下笔记。机器翻译和数据集机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。使用Encod...
2020-02-19 15:04:26 417
原创 《动手学深度学习PyTorch版》打卡_Task3,过拟合,欠拟合,梯度消失,梯度爆炸
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,对文本预处理、语言模型、循环神经网络做下笔记。过拟合和欠拟合模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting) 模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合解决方法权重衰减权重衰减等价于L2范数正则化(regulari...
2020-02-19 13:40:20 359
原创 《动手学深度学习PyTorch版》打卡_Task2,文本预处理、语言模型、循环神经网络
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,对文本预处理、语言模型、循环神经网络做下笔记。
2020-02-14 14:05:56 209
原创 《动手学深度学习PyTorch版》打卡_Task1,pytorch的常见函数
最近参加了伯禹平台和Datawhale等举办的《动手学深度学习PyTorch版》课程,也为了自己能尽快熟悉pytorch这个框架在这里整理一下自己遇到的pytorch常见函数。torch.ones()torch.ones(*sizes, out=None) → Tensor#返回一个全为标量 1 的张量,形状由可变参数sizes 定义。#sizes (int...) – 整数序列,定...
2020-02-14 13:18:57 156
原创 linux (ubuntu)下在局域网中发布java web遇到的问题
最近接手一个javaweb项目,需要移植到linux下,在配置好jdk,eclipse,tomcat,mysql之后,发现在本机运行项目之后局域网的小伙伴无法通过ip+端口+项目名访问。1、将项目从eclipse中导出,以.war的格式导出到tomcat下的webapps文件夹下。2、开放8081端口(没改过端口的应该是8080,一开始以为已经开放,结果是我之前将端口改为8081了) ...
2018-08-31 11:28:14 283
原创 (机器学习)梯度下降法技巧——特征缩放
学习了梯度下降法后看了相关资料总结一下一些技巧:1、特征缩放:适用问题:假设我们有两个特征(以二维举例)x1,x2。x1取值范围和x2取值范围相差过大,导致轮廓图是一个十分狭长的椭圆,这样在梯度下降的过程中可能要花费很多步才能到达局部最优解。对于这样的问题,我们可以通过特征缩放的方法来改变我们特征的取值范围,公式:特征的值/特征的最大值-最小值,这样把不同特征缩放到了[-1,1]区间,...
2018-08-16 14:08:58 690
原创 python中import...和from...import...的区别
<<python基础教程>>对cmath中的sqrt()没有使用from ... import ...。如果使用了这种import命令,将无法使用常规函数sqrt。类似这样的名称冲突很隐蔽,因此除非必须使用from版的import命令,否则应坚持使用常规版import命令。 ...
2018-08-07 15:35:10 331
原创 (个人笔记)python学习
https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014316399410395f704750ee9440228135925a6ca1dad8000在廖雪峰的官方网站上学习python,记录一下学习笔记。1.怎么在linux下直接执行.py文件而不是依靠python xxx.py...
2018-07-05 09:55:26 154
原创 (个人笔记)linux下cmake的使用
cmakelist的编写参考:https://www.ibm.com/developerworks/cn/linux/l-cn-cmake/毕设使用cmake对c++代码进行编译和生成可执行文件步骤:1.路径:打开Develop目录下的项目文件夹eg:colorchange2.cd buildcmake ..3.成功后执行make,生成可执行文件colorchange4. ./colorc...
2018-07-04 14:28:15 240
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人