神经网络一些基础学习和记录（1）

最新推荐文章于 2021-07-03 11:53:58 发布

groundhappy

最新推荐文章于 2021-07-03 11:53:58 发布

阅读量454

点赞数 1

分类专栏：机器学习和GPU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/groundhappy/article/details/84788629

版权

机器学习和GPU 专栏收录该内容

22 篇文章 0 订阅

订阅专栏

神经网络和深度学习

bilibili的吴恩达和网易的云课堂

识别一张图片是不是猫，的二分类使用逻辑回归。

对于一个猫的图片。假如长宽都是64（RGB），那么输入向量就是64*64*3。

(x,y)是一个样本一共有m个样本

对于一个给定的特征向量X（图片信息），需要知道Y hat（是否为猫的概率0-1）

y是标签。y hat是计算值。

就是得到一个 y=f(x)的函数。首先我们假定这个函数是个线性函数。

y hat=wT*x+b

对于二分类。有这个函数得到的y肯定不是位于0-1之前。所以我们对这个假定函数再做个处理，加上sigmod函数

把y值限定在0-1之间。接下来就是去寻找合适的w和b 使得每次代入特征向量x的时候能够得到一个比较准确的y值。

接下来就是如何来计算w以及b。我们用上标来代表每个样本和标签。

1 首先需要定义一个损失函数。用来计算计算值和估计值之前的差距。Loss Function（单个样本）

损失函数值越大，表明真实值和估计值差距很大，我们需要的是损失函数最小

我们可以使用平方差来估计。L(y hat,y)=1/2(y hat - y )^2。实际上不这么用是因为到时候用梯度下降法可能不太好用。

或者有可能这个损失函数是非凸的，可能找不到最优解。

这里使用L(y hat ,y)= - (y log (y hat) + ( 1 - y ) log ( 1 - y hat ) )

假设用极端准确和极端不准去的值来代入这个函数 ( log 0 不存在，所以取一个非常接近0的值)

y ,y hat = 0,1 - ( 0 log 1 + (1-0) log ( 1 - 1 ) ) = +无穷

y ,y hat = 1,0 +无穷

y ,y hat = 0,0 0

y ,y hat = 1,1 0

所以如果估计值和标签一致，那么损失为0.如果误差很大，那么也会给一个很大的损失值。

2我们再定义一个代价函数。代表所有样本的误差值。

这里我们就用一个平均值来计算吧。

J（w,b）=1/m sigma(from i 1 to n) L(y hat i ,y i)

所以我们需要选择合适的w和b使得J（w,b）最小

首先初始化一个权重。w，b可以取任意值。

采用梯度下降法下降的方式如下。

w=w- alpha * [ d (j w) / d (w) ]

alpha就是学习速率 [ d (j w) / d (w) ]是在w点的斜率

b也采取这样的形式迭代。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
神经网络一些基础学习和记录（1）

神经网络和深度学习bilibili的吴恩达和网易的云课堂识别一张图片是不是猫，的二分类使用逻辑回归。对于一个猫的图片。假如长宽都是64（RGB），那么输入向量就是64*64*3。(x,y)是一个样本一共有m个样本对于一个给定的特征向量X（图片信息），需要知道Y hat（是否为猫的概率0-1）y是标签。y hat是计算值。就是得到一个 y=f(x)的函数。首先我们假...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。