misakamikoto96-CSDN博客

原创梯度爆炸（有时候会在同一步爆炸）

梯度爆炸由于初始化权值过大，前面层会比后面层变化的更快，就会导致权值越来越大，梯度爆炸的现象就发生了。模型无法从训练数据中获得更新（如低损失）。模型不稳定，导致更新过程中的损失出现显著变化。训练过程中，loss变成 NaN or 大于了设定的阈值1.如果是同一步出现了爆炸或者loss突然增大，很有可能是training data中的某条数据有问题(建议有一个监测网络每次过滤掉问题值)2....

2019-08-07 15:53:23 174

原创 tensorflow增加新的层后重载模型部分参数

踩坑实录：在做迁移学习的时候经常会碰到增加了新的层却需要调取已有模型的部分参数的情况可以通过get_collection/看看该层的所有variablesvar = tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES,scope=‘新加入层的scope’)或者var=slim.get_variables('新加入层的scope')在rest...

2019-07-18 16:12:54 888

原创 Leetcode 动态规划——最大子序和

给定一个整数数组 nums ，找到一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。示例:输入: [-2,1,-3,4,-1,2,1,-5,4],输出: 6解释: 连续子数组 [4,-1,2,1] 的和最大，为 6。遍历def bianli_maxSubArray(nums): """ :type nums: List[int] :rtyp...

2018-09-26 21:50:22 140

原创算法图解笔记-散列表

散列散列表（HASHTABLE)数据结构目的在于创造一个运行时间为O(1)的万事通，比如一个记忆力良好的售货员maggie，她几乎记得清楚所有不同商品的价格。散列函数要求它必须是一致的。例如，假设你输入apple时得到的是4，那么每次输入apple时，得到的都必须为4。如果不是这样，散列表将毫无用处。它应将不同的输入映射到不同的数字。例如，如果一个散列函数不管输入是什么都返回1，它...

2018-09-21 02:28:23 326

原创无聊的肥宅反编译neko atsume猫咪后院（一）

作为neko atsume的脑残宅粉，本人最大的兴趣之一就是每天云养猫，吃饭在养，睡前在养，走路在养，写作业在养，蹲lab在养，到考试前夕了还在养。没想到自己会对放置play这么有热情的，每当心态凉凉的时候就想点开app看一眼我的喵们&gt;.&lt;。图鉴类的游戏往往能够抓住收集爱好者和强迫症患者的心，就像盖满章的手册一样，安全感指数级增长pupupu！鉴于一直搜集不全mementos，...

2018-09-10 15:43:19 1557

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 梯度爆炸 （有时候会在同一步爆炸）

原创 tensorflow增加新的层后重载模型部分参数

原创 Leetcode 动态规划——最大子序和

原创 算法图解笔记-散列表

原创 无聊的肥宅反编译neko atsume猫咪后院 （一）

空空如也

空空如也

原创梯度爆炸（有时候会在同一步爆炸）

原创算法图解笔记-散列表

原创无聊的肥宅反编译neko atsume猫咪后院（一）