- 博客(5)
- 收藏
- 关注
原创 梯度爆炸 (有时候会在同一步爆炸)
梯度爆炸由于初始化权值过大,前面层会比后面层变化的更快,就会导致权值越来越大,梯度爆炸的现象就发生了。模型无法从训练数据中获得更新(如低损失)。模型不稳定,导致更新过程中的损失出现显著变化。训练过程中,loss变成 NaN or 大于了设定的阈值1.如果是同一步出现了爆炸或者loss突然增大,很有可能是training data中的某条数据有问题(建议有一个监测网络每次过滤掉问题值)2....
2019-08-07 15:53:23 174
原创 tensorflow增加新的层后重载模型部分参数
踩坑实录:在做迁移学习的时候经常会碰到 增加了新的层却需要调取已有模型的部分参数的情况可以通过get_collection/看看该层的所有variablesvar = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES,scope=‘新加入层的scope’)或者var=slim.get_variables('新加入层的scope')在rest...
2019-07-18 16:12:54 888
原创 Leetcode 动态规划——最大子序和
给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。示例:输入: [-2,1,-3,4,-1,2,1,-5,4],输出: 6解释: 连续子数组 [4,-1,2,1] 的和最大,为 6。遍历def bianli_maxSubArray(nums): """ :type nums: List[int] :rtyp...
2018-09-26 21:50:22 140
原创 算法图解笔记-散列表
散列散列表(HASHTABLE)数据结构目的在于创造一个运行时间为O(1)的万事通,比如一个记忆力良好的售货员maggie,她几乎记得清楚所有不同商品的价格。散列函数要求它必须是一致的。例如,假设你输入apple时得到的是4,那么每次输入apple时,得到的都 必须为4。如果不是这样,散列表将毫无用处。它应将不同的输入映射到不同的数字。例如,如果一个散列函数不管输入是什么都返回1, 它...
2018-09-21 02:28:23 326
原创 无聊的肥宅反编译neko atsume猫咪后院 (一)
作为neko atsume的脑残宅粉,本人最大的兴趣之一就是每天云养猫,吃饭在养,睡前在养,走路在养,写作业在养,蹲lab在养,到考试前夕了还在养。没想到自己会对放置play这么有热情的,每当心态凉凉的时候就想点开app看一眼我的喵们>.<。图鉴类的游戏往往能够抓住收集爱好者和强迫症患者的心,就像盖满章的手册一样,安全感指数级增长pupupu!鉴于一直搜集不全mementos,...
2018-09-10 15:43:19 1557
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人