Udacity DEEPLEARNING 学习笔记 L1 Mechine Learning to DeepLearning

最新推荐文章于 2019-05-18 17:20:34 发布

somTian

最新推荐文章于 2019-05-18 17:20:34 发布

阅读量2.3k

点赞数

分类专栏： udacity深度学文章标签：深度学习 udacity

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/somTian/article/details/53152120

版权

udacity深度学专栏收录该内容

4 篇文章 0 订阅

订阅专栏

说明：
1. 这个谷歌在udacity上开设的一门deeplearning免费课程，可以通过这个链接访问，笔记中所有的文字和图片都来自这门课，在此感谢这些大牛们的免费分享
2. 这是我自己的学习笔记，错误和遗漏之处肯定很多，还有一些细节没有解释。另外，有些地方直接把英文复制过来是因为理解很简单或者我自己理解不了。
3. 笔记目录：
- L1 Mechine Learning to DeepLearning
- L2 DEEP NEURAL NETWORK
- L3 CONVOLUTIONAL NEURAL NETWORKS
- L4 TEXT AND SEQUENCE MODEL

INTRODUCE

Deeplearning shines wherever there isi lots of data and complex problem to solve.

One of the nice things of deeplearning is that it’s really a family of techniques that adapts to all sorts of data and all sorts of problems, all using a common infrastructure and a common language to describe things.

What changed ?

Lots of data

and cheap and fast GPs

BASIC

SOFTMAX函数

one-hot encoding

cross entropy

梯度下降和随机梯度下降

APPLICATION

验证集越大，结果越精确
不要迷信训练速度，这和你的模型好坏并没有直接的关系
- 超参数设置
INITIAL LEARNING RATE

LEARNING RATE DECAY

MOMENTON

BATCH SIZE

WEIGHT INITIALIZATION
- It’s that when things don’t work, always try to lower your learning rate first
  
  当训练出现问题时，首先要进行的调整的降低学习率
- AdaGrad that makes thing a little bit easier.
介绍一个对SGD进行优化的算法AdaGrad，AdaGrad使用动量来防止过拟合，且学习率自动衰减，可降低训练过程对超参数的敏感度，但准确率比使用动量的SGD要低一些。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。