fastai2017（四）

yeyustudy

于 2018-10-05 20:17:17 发布

阅读量271

点赞数

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yeyustudy/article/details/82940511

版权

人工智能专栏收录该内容

34 篇文章 1 订阅

订阅专栏

1、当为了微调模型对已有模型添加批量正则化需要注意，如果直接添加的话，批量正则化会将激活值归一化，这意味着以后的权值跟已有模型相比会发生改变，所以不能这样操作，解决的办法是人为的计算出上一层输出的均值跟方差，然后利用这两个参数设定批量正则化层的权值分布，这样的话以后的权值就可以使用了
2、在自然语言处理中，不需要像在计算机视觉中那样传送整个预训练权值，只需要传送预训练词向量即可，也就是学习完成的词嵌入（embedding）
3、在NLP中，也可以使用卷积层，不过此时使用的是一维的卷积层
4、进行训练时，通常使用预训练的词向量，此时嵌入层的权值设置为不可改变，经过几个epoch的训练之后，将嵌入层的权值设为可训练进行训练词向量，这样操作效果会更好。
5、当对卷积核大小无法把握的时候，一种是慢慢尝试卷积核的大小，另一种是同时设置不同卷积核大小的网络，然后将这些网络结合在一起成为一层，观察训练的效果，这些网络的关系式并列关系，之后将这一层嵌入到神经网络中，代码如下：
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
fastai2017（四）

1、在自然语言处理中，不需要像在计算机视觉中那样传送整个预训练权值，只需要传送预训练词向量即可，也就是学习完成的词嵌入（embedding）2、在NLP中，也可以使用卷积层，不过此时使用的是一维的卷积层3、进行训练时，通常使用预训练的词向量，此时嵌入层的权值设置为不可改变，经过几个epoch的训练之后，将嵌入层的权值设为可训练进行训练词向量，这样操作效果会更好。4、当对卷积核大小无法把握的时...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。