自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

dwSun的博客

一个正经的IT工作者/非著名人工智能表演艺术家/非著名业余摄影爱好者

09月 07月 05月 04月 03月

原创 1506.01186-Cyclical Learning Rates for Training Neural Networks

1506.01186-Cyclical Learning Rates for Training Neural Networks 1506.01186-Cyclical Learning Rates for Training Neural Networks论文中提出了一种循环调整学习率来训练模型的方式。如下图：通过循环的线性调整学习率，论文作者观察到的一种比较...

2018-07-30 21:13:00 377

原创 1503.02531-Distilling the Knowledge in a Neural Network.md

1503.02531-Distilling the Knowledge in a Neural Network.md 原来交叉熵还有一个tempature，这个tempature有如下的定义：\[q_i=\frac{e^{z_i/T}}{\sum_j{e^{z_j/T}}}\]其中T就是tempature，一般这个T取值就是1,如果提高：In [6]: ...

2018-07-11 23:06:00 340

原创 1804.03235-Large scale distributed neural network training through online distillation.md

1804.03235-Large scale distributed neural network training through online distillation.md 现有分布式模型训练的模式分布式SGD并行SGD：大规模训练中，一次的最长时间取决于最慢的机器异步SGD：不同步的数据，有可能导致权重更新向着未知方向并行多模型：多个集...

2018-07-05 23:40:00 921

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

_dwSun_

CSDN认证博客专家 CSDN认证企业博客

码龄7年

IP 属地：江苏省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

46: 原创

1万+: 周排名

100万+: 总排名

19万+: 访问

: 等级

1192: 积分

156: 粉丝

114: 获赞

63: 评论

483: 收藏

私信

关注

热门文章

分类专栏

视频教程
教程 17篇

最新评论

元宇宙与脑机接口
a.过去现在时。: 其次才是体感模拟
元宇宙与脑机接口
a.过去现在时。: 我也觉得脑机接口是通往元宇宙的最优路劲
mxnet 图像分类模型训练教程
_dwSun_: 这个是opencv 的处理方式决定的
mxnet 图像分类模型训练教程
清风莫追: 博主你好！为什么mxnet要对图像的加载和训练使用不同的数据集呀：同时，mxnet 用 opencv 来处理图像的加载，其图像的数据 layout 是（H，W，C），而 mxnet 用来训练的数据需要是（C，H，W）的，因此需要对数据做一些转换。
Jetson-Nano开箱配置及Tensorflow安装使用
#Dawn#: 引用「记本电脑略慢一点，但是考虑这个开发板5W的功耗，还要啥自行车。jetson的显存和内存是共享的，一共」 pytorch的安装似乎要更简单一点... 主要是dependency配置简单一些

最新文章

提示

确定要删除当前文章？

取消删除