在我们的实际应用中,尝尝需要求取某一个函数的极值。例如给定函数y=f(x),我们看作输入为x,返回结果为y。同样的我们可以定义函数F(y)作为输入为y,返回值为F的函数,其中y同时也是关于x的函数。例如在机器学习中广泛使用的熵概念H(x),H(x)是关于x分布p(x)的函数,因此H(x)可以等价的写为H(p)。
在常规微积分中,一个普遍的问题就是寻找一个x是f(x)取得极大值或者是极小值,同样的我们也可以寻找一个f(x)使得H(f)取得极大值或者是极小值。
在常规微积分中,根据微分的定义,我们可以得到通过对变量x最一个很小的改变 可以得到
同样的对于多变量函数,我们做出同样的定义
当我们考虑函数H(y)时,当我们对y(x)做一个微小的变动时,H的值变化会有多大。我们假设H(y)对y(x)的微分记为δF/δf(x),定义如下关系:
根据微分的定义,当f(x)最细微的改变时,函数值F(y)应该保持不变,因此
因为 η(x)是任意的,而且上面的等式对于任意的x均要成立,所以要求等式中的微分为零。
考虑一个函数,函数定义为:
假设函数y(x)在积分边界是值是确定的。根据上面的定义,我们可以得到:
进过变换我们可以得到:
因为 η(x)是任意的,所以
接下来这样就可以使用解微分方程的方法的到我们想要的y(x)