中科大-凸优化笔记（lec13）-一些常见的凸函数（下）

最新推荐文章于 2023-03-20 00:58:05 发布

及时行樂_

最新推荐文章于 2023-03-20 00:58:05 发布

阅读量3.8k

点赞数 7

分类专栏： # 中科大-最（凸）优化学习笔记

本文链接：https://blog.csdn.net/qq_41485273/article/details/113729453

版权

中科大-最（凸）优化学习笔记专栏收录该内容

51 篇文章 211 订阅

订阅专栏

本文详细介绍了凸优化中的几个关键概念：log-sum-exp函数的性质，证明了它是凸函数；几何平均的凹性特性；以及对称半正定矩阵行列式的对数，通过拉格朗日乘子法展示了其为凹函数。这些内容对于理解和应用凸优化至关重要。

摘要由CSDN通过智能技术生成

全部笔记的汇总贴（视频也有传送门）：中科大-凸优化

一、log-sum-exp（解析逼近）

$f(x)=\log(e^{x_1}+\cdots+e^{x_n})\;\;\;\;x\in\R^n$
$\max\{x_1,\cdots,x_n\}\le f(x)\le\max\{x_1+\cdots+x_n\}+\log n$

$\frac{\partial f}{\partial x_i}=\frac{e^{x_i}}{e^{x_1}+\cdots+e^{x_n}},\;\;H=\Big[\;H_{ij}\;\Big]$

当 $i\neq j$ 时， $\frac{\partial^2 f}{\partial x_i \partial y_i}=\frac{-e^{x_i}e^{x_j}}{(e^{x_1}+\cdots+e^{e_n})^2}=\frac{-e^{x_i}e^{x_j}}{(1||z||)^2}$
当 $i = j$ 时， $\frac{\partial^2 f}{\partial x_i^2}=\frac{-e^{x_i}e^{x_i}+e^{x_i}(e^{x_1}+\cdots+e^{x_n})}{(e^{x_1}+\cdots+e^{e_n})^2}=\frac{-e^{x_i}e^{x_i}+e^{x_i}1^Tz}{(1||z||)^2}$

其中 $z=[e^{x_1},\cdots,e^{x_n}]^T$
$H=\underset{>0}{\underbrace{\frac1{(1^Tz)^2}}}\underset{K\in\R^{n*n}}{\underbrace{((1^Tz)diag\{z\}-zz^T)}}$
$\forall v\in\R^n\;\;\;\;\;v^TKv\ge0$
$v^TKv=(1^Tz)v^Tdiag\{z\}v-v^Tzz^Tv\\=\underset{b^Tb}{\underbrace{(\sum_iz_i)}}\underset{a^Ta}{\underbrace{(\sum_iv_i^2z_i)}}-\underset{a^Tb}{\underbrace{(\sum_iv_iz_i)^2}}$
$a_i=v_i\sqrt{z_i}\;\;\;\;b_i=\sqrt{z_i}$
$v^TKv=(b^Tb)(a^Ta)-(a^Tb)^2\ge0$
Cachy-Schwartz不等式
$\Rightarrow$ log-sum-exp是凸函数

二、几何平均

$f(x)=(x_1\cdot…\cdot x_n)^{\frac1n}\;\;\;\;x\in\R^n_{++}$
是个凹函数，这里限制每一个分量都非负主要是不想考虑复数的情况。

三、对称半正定矩阵的行列式的对数

$f(x)=\log det(x)\;\;\;\;dom f=S_{++}^n$

当 $n = 1$ 时，是凹函数；

当 $n > 1$ 时， $\forall z\in S_{++}^n,\forall t\in\R,\forall v\in\R^{n*n}$
$z+tv\in S_{++}^n=dom f，故v\in S^n$
$g(t)=f(z+tv)=\log det(z+tv)\\=\log det\{z^{\frac12}(I+tz^{-\frac12}vz^{\frac12})z^{\frac12}\}\\=\log det\{z\}+\log det\{I+\underset{\lambda_i为该矩阵的特征值}{\underbrace{tz^{-\frac12}vz^{\frac12}}}\}\\=\log det\{z\}+\sum_{i=1}^n\log(1+t\lambda_i)$

令 $tz^{-\frac12}vz^{\frac12}=Q\Lambda Q^T\;\;\;\;\;\;QQ^T=I$

$det(I+tz^{-\frac12}vz^{\frac12})=det(QQ^T+Q\Lambda Q^T)\\=det(Q)det(I+\Lambda)det(Q^T)\\=det(\underset{\color{blue}I_n}{QQ^T})det(\underset{\color{blue}1+\lambda_i}{I+\Lambda})$