非线性优化之牛顿（梯度）下降法、高斯牛顿法、LM下降法

最新推荐文章于 2024-05-29 13:25:29 发布

BUAA-XX

最新推荐文章于 2024-05-29 13:25:29 发布

阅读量1.9k

点赞数

分类专栏： Python，算法数值分析文章标签：优化 numpy

本文链接：https://blog.csdn.net/sinat_33829806/article/details/78388322

版权

Python，算法同时被 2 个专栏收录

27 篇文章 0 订阅

订阅专栏

数值分析

7 篇文章 0 订阅

订阅专栏

本质都是基于梯度下降法。
牛顿法：依赖于Hessen矩阵非奇异，收敛较快
高斯牛顿法：依赖二阶项的jacobian 解决了Hessen非奇异的问题，收敛相对慢
LM下降法：表现是使用一个因子拟合牛顿和高斯牛顿法

#coding=utf-8
from numpy import *
import sympy

def Hessen(f,x,x_value):
        #行 列表示Hesse矩阵
    num=len(x)
    lis2=mat([[1.0 for i in range(num)] for i in range(num)],dtype=float64)
        for i in range(num):
        for j in range(i,num):
            f1=sympy.diff(f,x[i],1)
            f2=sympy.diff(f1,x[j],1)
            value= f2.subs(x_value)
            lis2[i,j]=value
    return lis2


def Jacobian(f,x,x_value):
    num=len(x)
    lis1=mat([1.0 for i in range(num)])
    #print lis1
    for i in range(num):
        s2=sympy.diff(f,x[i],1)
        value= s2.subs(x_value)
        #print value
        lis1[0,i] =value
        #print lis1[0,i]
    return lis1.T

def handle(n): 
    x=[1 for i in range(n)]
    for i in range(n):
        str1='x['+str(i)+']'
        x[i] = sympy.Symbol(str1)
    return x

def Newton(f,x_value,maxIter):
    num=len(x_value.keys())
    x=handle(num)
    #求逆运算的问题
    error=f.subs(x_value)
    try:
        for i in range(maxIter):
            hessen=Hessen(f,x,x_value)
            I=mat(zeros((num,num)))
            #for q in range(num):
            #   I[q,q]=0.001
            jacobian=Jacobian(f,x,x_value)      
            delta=-1*dot((linalg.inv(hessen)+I),jacobian)
            #delta=dot(delta,error)
            #print jacobian,hessen,delta        
            for j in range(num):
                x_value[x[j]]=x_value[x[j]]+delta[j,0]
            error=f.subs(x_value)
            print i,error
    except:
        print "gradient is vanish"
    return x_value,error


def GaussNewton(f,x_value,maxIter):
    num=len(x_value.keys())
    x=handle(num)
    #求逆运算的问题
    error=f.subs(x_value)
    try:
        for i in range(maxIter):
            jacobian=Jacobian(f,x,x_value)  
            J1=dot(jacobian.T,jacobian)
            #print J1   
            J2=-1.0*dot(linalg.inv(J1),jacobian.T)
            delta=dot(J2,error).T   
            for j in range(num):
                x_value[x[j]]=x_value[x[j]]+delta[j,0]
            error=f.subs(x_value)
            print i,error
    except:
        pass
    return x_value,error



def LM(f,x_value,maxIter):
    num=len(x_value.keys())
    x=handle(num)
    #求逆运算的问题
    #last_value=f.subs(x_value)
    error=f.subs(x_value)
    lr=0.000001
    for i in range(maxIter):
        jacobian=Jacobian(f,x,x_value)  
        J1=dot(jacobian.T,jacobian)
        #print jacobian

        I=mat(zeros((len(J1),len(J1))))
        for q in range(len(J1)):
            I[q,q]=lr

        J1=J1+I
        J2=-1.0*dot(linalg.inv(J1),jacobian.T)
        delta=dot(J2,error).T

        for j in range(num):
            x_value[x[j]]=x_value[x[j]]+delta[j,0]
        if(f.subs(x_value)>=error):
            lr=lr*5
        else:
            lr=0.000001
        error=f.subs(x_value)
        print i,error
    return x_value,error




x=handle(2)
# sin cos need  like : sympy.sin()
f=(3-x[0])**2+(7-x[1])**2

x_value={x[0]:-1.5,x[1]:0.5};
maxIter=100

lis1=Jacobian(f,x,x_value)
#print lis1

lis2=Hessen(f,x,x_value)
#print lis2

#限制因素 非奇异矩阵
#Newton(f,x_value,100)

#GaussNewton(f,x_value,100)

#LM(f,x_value,100)

BUAA-XX

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
非线性优化之牛顿（梯度）下降法、高斯牛顿法、LM下降法

本质都是基于梯度下降法。牛顿法：依赖于Hessen矩阵非奇异，收敛较快高斯牛顿法：依赖二阶项的jacobian 解决了Hessen非奇异的问题，收敛相对慢 LM下降法：表现是使用一个因子拟合牛顿和高斯牛顿法#coding=utf-8from numpy import *import sympydef Hessen(f,x,x_value): #行列表示Hesse矩
复制链接

扫一扫

专栏目录