自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(4)
  • 收藏
  • 关注

转载 transformer-xl

转载于:https://www.cnblogs.com/zhufz/p/11365149.html

2019-08-16 17:14:00 231

转载 优化器

sgd,adagrad支持了自适应学习率,通过累积历史平方梯度,对学习率进行缩放达到自适应的效果;rmsprop加了一个累积值的衰减策略,adam不光加了平方梯度累积值的衰减,还加了梯度累积值的衰减。nag是带动量的sgd(nesterov+sgd),而nadam是带动量的adam。转载于:https://www.cnblogs.com/zhufz/p/1135243...

2019-08-14 15:49:00 95

转载 batch normalization 与 layer normalization

bn和ln的本质区别:batch normalization是纵向归一化,在batch的方向上对同一层每一个神经元进行归一化,即同一层每个神经元具有不同的均值和方差。layer normalization 是横向归一化,即同一层的所有神经元具有相同的均值和方差。bn和ln的使用区别:1.如果batch size过小,那么得到的统计量难以反应全局信息,因此不...

2019-08-14 15:46:00 232

转载 nlp四大任务(分类、匹配、序列标注、文本生成)集成项目

介绍本项目支持的NLP任务包括 分类、匹配、序列标注、文本生成等.- 对于分类任务,目前支持多分类、多标签分类,通过选择不同的loss即可。- 对于匹配任务,目前已支持交互模型和表示模型。- 对于NER任务,目前已支持rnn+crf,idcnn+crf以及bert+crfgit地址:https://github.com/zhufz/nlp_research数...

2019-08-10 16:05:00 1252

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除