deeplearning_xxl98330的博客-CSDN博客

自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

xxl98330 CSDN认证博客专家 CSDN认证企业博客

码龄12年

4: 原创

39万+: 周排名

111万+: 总排名

3万+: 访问

: 等级

537: 积分

12: 粉丝

19: 获赞

13: 评论

76: 收藏

私信

关注

热门文章

分类专栏

c++ 3篇
mfc 4篇
Windows 1篇
算法与数据结构 2篇
ADO SQL 1篇
deeplearning 1篇
NLP 1篇

最新评论

详解Attention机制及Tensorflow之attention_wrapper
lijie_00191980: self._probability_fn(score, previous_alignments) 请问这第二个参数是干啥用的，这个具体是如何计算的，从代码没看出来
详解Attention机制及Tensorflow之attention_wrapper
qq_43343004: 博主您好，请问您最后给的decoder简单应用的例子中，memory=context，context具体传入的是什么呢？
详解Attention机制及Tensorflow之attention_wrapper
yjiangling: 博主你好，首先非常感谢你的总结和分享，在阅读过程中一些疑惑一直不解，希望能得到你的帮助。在_computr_attention函数中，计算context的时候，attention_mechanism.values是什么东西啊？难道不是encoder的输出结果memory吗（也就是公式里面的h）？为什么这个tensor的维度是[batch_size, memory_time, attention_mechanism.num_units]啊？按道理来说如果是encoder的输出，最后一维应该是encoder网络隐藏层节点的个数吧？求解惑，非常感谢~ [code=python] # attention_mechanism.values shape is # [batch_size, memory_time, attention_mechanism.num_units] # the batched matmul is over memory_time, so the output shape is # [batch_size, 1, attention_mechanism.num_units]. # we then squeeze out the singleton dim. context = math_ops.matmul(expanded_alignments, attention_mechanism.values) context = array_ops.squeeze(context, [1]) ———————————————— 版权声明：本文为CSDN博主「xxl98330」的原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/xxl98330/article/details/79818140 [/code]
google bert模型详解源码解析
xxl98330 回复 zhenxi_123: 如果结果没问题的话，是二进制文件
google bert模型详解源码解析
zhenxi_123: 博主，--output_file=/tmp/tf_examples.tfrecord 输出文件是保存到哪里了，我换个路径输出后，里面的数据都是一堆乱码，这是怎么回事，求解答，谢谢了

最新文章

deeplearning

关注

关注数：文章数：2 文章阅读量：21908 文章收藏量：78

作者: xxl98330

stay hungry stay foolish

展开