机器学习数学笔记|微积分梯度jensen不等式

最新推荐文章于 2022-11-25 21:34:55 发布

武科大许志伟

最新推荐文章于 2022-11-25 21:34:55 发布

阅读量1.3k

点赞数

分类专栏：机器学习机器学习基础文章标签：机器学习数学

本文链接：https://blog.csdn.net/u013555719/article/details/78502634

版权

53 篇文章 3 订阅

订阅专栏

29 篇文章 8 订阅

订阅专栏

原创文章,如需转载请保留出处
本博客为七月在线邹博老师机器学习数学课程学习笔记
为七月在线打call!!
课程传送门

微积分与梯度

$自然常数e可以看做e=1+\frac{1}{1!}+\frac{1}{2!}+\frac{1}{3!}+\frac{1}{4!}+...+\frac{1}{n!}$

对于方向导数我们也可以视为
$(\frac{\partial f}{\partial x},\frac{\partial f}{\partial y}).(cos\varphi.sin\varphi)^{T}$

方向导数顾名思义既是复合函数在某一方向上的导数，表示函数在某一方向上的变化趋势。当在某一方向上的方向导数最大时，即是梯度
当
$cos\varphi =\frac{\partial f}{\partial x}\\sin\varphi = \frac{\partial f}{\partial y}$
时,这是方向导数取最大值,即是梯度

对于梯度我们有

Jensen不等式相当于把凸函数的概念反过来说,即是如果f是一个凸函数,任意取一个在f定义域上的(x,y)点, $\theta$ 属于[0,1].
当只有x,y两个参数,即是使用 基本Jensen不等式 ,然而当推广到k个参数时, 即是表示参数的线性加权的函数值总要小于函数值的线性加权.
可以将其推广到概率密度分布上,假设 $\theta$ 表示是事件的概率密度K点分布即所加和为1,则函数值的期望大于期望的函数值

PS:这都是在f是凸函数的状况下!
Jensen不等式是所有不等式的基础,所有不等式都能看做是Jensen不等式利用不同的凸函数推导出来的.