小闹钟的机器学习笔记(4)

本次学习内容为cs229第四节

牛顿方法

要求f(x)=0时对应的x值,先假设出一个x((0)),对其对应的函数值作切线,相交x轴于第二个点x((1)),如此反复,就可以逐渐逼近要求的点。

这里写图片描述

其实delta表示((0))到x((1))的距离,对应点的倒数为高度除以距离。
这样就完成了牛顿方法的一次迭代。

要使得找到某点,使得该点对应的函数值最大,则需要使其对应的导数为0。
因此把其导函数l’(x)定位为f(x),则得到如下内容:

这里写图片描述

牛顿算法是一个收敛速度非常快的二次收敛方法,每次迭代都会使你的逼近加倍。
使用牛顿方法求最小化的步骤也如此,没有变化。

指数分布族

假设我们有一组只能取0或1的数据,我们希望用伯努利分布对其建模。当你改变参数时,你会得到不同的概率分布。同样适用于高斯分布。

指数分布族

对于一个给定的a,b,T,通过改变参数值可以得到伯努利分布或者告诉分布。
将伯努利分布变为指数分布族的形式:

这里写图片描述

而其中的a,b,T,则分别如下:

这里写图片描述

指数分布族的公式中参数同伯努利分布的参数有着特定的关系。
同样高斯分布也可以写成指数分布族的形式:

这里写图片描述

多项式分布、伽马分布、指数分布也属于指数分布族。事实上,大多数分布都可以写成指数分布族的形式。

广义线性模型

通常被写成GLM。

  1. 给定x和theta,使得y的概率分布属于指数分布族。
  2. 给定x,目标是输出E[T(y)|x]。换句话说,h(x)=E[T(y)|x]。
  3. 给出参数间的假设关系。
    这里写图片描述

通过伯努利建模得到逻辑回归的过程:

这里写图片描述

也可以选择不同的分布来求得不同的广义线性模型。
将参数同y的期望值联系出来的函数g称为正则响应函数。

多项式分布

首先让我们将多项式分布写成指数分布族的形式。

这里写图片描述

这是一个少有的T(y)不等于y的例子,在这个例子中,T是一个随着y值变化的向量。

这里写图片描述

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值