ayz30868
码龄10年
关注
提问 私信
  • 博客:2,472
    2,472
    总访问量
  • 暂无
    原创
  • 1,788,494
    排名
  • 0
    粉丝
  • 0
    铁粉
  • 加入CSDN时间: 2014-11-20
博客简介:

ayz30868的博客

查看详细资料
  • 原力等级
    当前等级
    0
    当前总分
    0
    当月
    0
个人成就
  • 获得0次点赞
  • 内容获得0次评论
  • 获得2次收藏
创作历程
  • 7篇
    2019年
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

tensorflow 相关

1.从checkpoint中获取全部的变量名和变量值tf.contrib.framework.list_variables(model_dir)tf.contrib.framework.load_variable(model_dir, var_name)2.清除 tf.Sessiontf.reset_default_graph() 重置计算图3....
转载
发布博客 2019.09.27 ·
158 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一些需要注意的细节

1.离散采样不可导问题,使用gumbel采样方式将不可导部分拉出计算图细节做法https://www.cnblogs.com/initial-h/p/9468974.html2.关于NLLloss和cross entropy loss 的关系和区别cross中是计算概率模型输出的概率p和真实的分布之间的交叉熵,NLL是直接求负对数似然,如果交叉熵的使用的概率p是使用softm...
转载
发布博客 2019.09.05 ·
118 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

机器翻译(machine translation)相关

1.BLEU主要任务是为了将候选的n-gram和target的n-gram相比较,匹配相似度(与位置无关)基本做法:比较翻译结果中和参考的n-gram个数,直接相除,问题是长句子会得分更高,限制句子长度加入惩罚参数,同时对不同的目标任务对n-gram赋予不同的权重2.attention 的细节总结注意力机制目的是达到一个对齐(alignment)的作用,通俗来说...
转载
发布博客 2019.09.05 ·
456 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

模型集成-ensamble

1.综述资料集合模型是由于有较高的方差产生,集成多个模型可以减小方差,为了使模型有集成有效,需要每一模型都需要是很好的模型但是需要犯不同的错误,结果会更鲁棒一些主要参考内容https://machinelearningmastery.com/stacking-ensemble-for-deep-learning-neural-networks/ ,包含了很多集成的代码实现...
转载
发布博客 2019.08.30 ·
605 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

代码-动态规划

1.动态规划三角形问题 1 class Solution(object): 2 def minimumTotal(self, triangle): 3 """ 4 :type triangle: List[List[int]] 5 :rtype: int 6 """ 7 ...
转载
发布博客 2019.08.21 ·
168 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MT框架中ensemble的做法

1.在opennmt框架代码中ensemble的做法是在opennmt/utils/checkpoint.py 1 def average_checkpoints(model_dir, output_dir, max_count=8, session_config=None): 2 """Averages checkpoints. 3 4 Args: 5...
转载
发布博客 2019.09.05 ·
482 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

知识蒸馏(Knowledge Distilling)

1.参考资料,一个很好的KD的资料list https://github.com/dkozlov/awesome-knowledge-distillation一个中文的相关资料https://www.zhihu.com/question/333196499/answer/738197683一些找到的跟KD相关的资料https://github.com/lhyfst/...
转载
发布博客 2019.08.30 ·
486 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏