![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
Parallax_2019
初极狭,才通人。复行数十步,豁然开朗。----T
展开
-
极客云GPU使用
首先将数据集通过数据上传到云上,然后通过teminal将数据从data迁移到input/data中其次在云上的jupyter定义好模型,训练即可如果有模块,也需要通过上传数据功能导入到jupyter。不用记得关机。Tensorboard默认是关闭的,如需打开Tensorboard,请在Terminal中输入tb回车,之后在列表中点击Tensorboard链接即可打开。Tensorb...原创 2019-03-31 18:30:19 · 2637 阅读 · 1 评论 -
MobileNet
要看MobileNet先看Xception。Xception是inception V3的改进,具体是引入了深度可分卷积结构将传统的卷积操作分成两步,假设原来是3*3的卷积,那么depthwise separable convolution就是先用M个3*3卷积核一对一卷积输入的M个feature map,不求和,生成M个结果;然后用N个1*1的卷积核正常卷积前面生成的M个结果,求和,最后生成N...原创 2019-05-28 16:32:53 · 163 阅读 · 0 评论 -
交叉熵损失函数的优点
利用一些饱和激活函数的如sigmoid激活时,假如利用均方误差损失,那么损失函数向最后一层的权重传递梯度时,梯度公式为可见梯度与最后一层的激活函数的导数成正比,因此,如果起始输出值比较大,也即激活函数的导数比较小,那么整个梯度幅度更新幅度都比较小,收敛时间很长。若一开始输出值比较小那么更新速度比较好,收敛也快,因此不稳定。且与输出值a与真实值的误差成正比。再看损失函数改成交叉熵损失时:...原创 2019-05-28 19:19:55 · 14007 阅读 · 0 评论