吴恩达Coursera深度学习课程 DeepLearning.ai 提炼笔记(1-2)-- 神经网络基础


作者大树先生
博客http://blog.csdn.net/koala_tree
GitHubhttps://github.com/KoalaTree
2017 年 09 月 20 日


以下为在Coursera上吴恩达老师的DeepLearning.ai课程项目中,第一部分《神经网络和深度学习》第二周课程部分关键点的笔记。笔记并不包含全部小视频课程的记录,如需学习笔记中舍弃的内容请至Coursera 或者 网易云课堂。同时在阅读以下笔记之前,强烈建议先学习吴恩达老师的视频课程。


同时我在知乎上开设了关于机器学习深度学习的专栏收录下面的笔记,方便在移动端的学习。欢迎关注我的知乎:大树先生。一起学习一起进步呀!^_^


神经网络和深度学习—神经网络基础

1. 二分类问题

对于二分类问题,大牛给出了一个小的Notation。

  • 样本: (x,y) ,训练样本包含 m 个;
  • 其中 xRnx ,表示样本 x 包含 nx 个特征;
  • y0,1 ,目标值属于0、1分类;
  • 训练数据: { (x(1),y(1)),(x(2),y(2)),,(x(m),y(m))}

输入神经网络时样本数据的形状:

这里写图片描述

X.shape=(nx,m)

目标数据的形状:

Y=[y(1),y(2),,y(m)]

Y.shape=(1,m)

2. logistic Regression

逻辑回归中,预测值:

h^=P(y=1|x)

其表示为1的概率,取值范围在 [0,1] 之间。

引入Sigmoid函数,预测值:

y^=Sigmoid(wTx+b)=σ(wTx+b)
其中
Sigmoid(z)=11+ez

注意点:函数的一阶导数可以用其自身表示,

σ(z)=σ(z)(1σ(z))

这里可以解释梯度消失的问题,当 z=0 时,导数最大,但是导数最大为 σ(0)=σ(0)(1σ(0))=0.5(10.5)=0.25 ,这里导数仅为原函数值的0.25倍。

参数梯度下降公式的不断更新, σ(z) 会变得越来越小,每次迭代参数更新的步伐越来越小,最终接近于0,产生梯度消失的现象。

3. logistic回归 损失函数

Loss function

一般经验来说,使用平方错误(squared error)来衡量Loss Function:

L(y^,y)=12(y^y)2

但是,对于logistic regression 来说,一般不适用平方错误来作为Loss Function,这是因为上面的平方错误损失函数一般是非凸函数(non-convex),其在使用低度下降算法的时候,容易得到局部最优解,而不是全局最优解。因此要选择凸函数。

逻辑回归的Loss Function:

L(y^,y)=(ylogy^+(1y)
  • 80
    点赞
  • 154
    收藏
    觉得还不错? 一键收藏
  • 24
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 24
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值