优化论(1)--机器学习数学基础--思维导图和笔记(25)

一、思维导图

二、补充笔记

1、梯度的定义

$$\nabla f(x) = \frac{{\partial f(x)}}{{\partial x}} = \left[ \begin{array}{l}\frac{{\partial f(x)}}{{\partial {x_1}}}\\{\rm{ }} \vdots \\\frac{{\partial f(x)}}{{\partial {x_n}}}\end{array} \right]$$

2、Hessian矩阵定义

$${\nabla ^2}f(x) = \frac{{\partial f(x)}}{{\partial x}} = \left[ \begin{array}{l}\frac{{{\partial ^2}f(x)}}{{\partial x_1^2}} \cdots \frac{{{\partial ^2}f(x)}}{{\partial {x_1}\partial {x_n}}}\\{\rm{ }} \vdots {\rm{   }} \ddots {\rm{   }} \vdots \\\frac{{{\partial ^2}f(x)}}{{\partial {x_n}\partial {x_1}}} \cdots \frac{{{\partial ^2}f(x)}}{{\partial x_n^2}}\end{array} \right]$$

3、正定矩阵

给定对称矩阵$$A \in {R^{n \times n}}$$ 如果对于所有的$$x \in {R^n}$$ 有$${x^T}Ax \ge 0$$为半正定矩阵 特征值$$\lambda (A) \ge 0$$ 如$$x \ne 0$$ 有$${x^T}Ax > 0$$ 则为正定矩阵。同样可以定义负定矩阵和不定矩阵。

四、常见梯度求解

向量ax无关,那么$$\nabla ({a^T}x) = a$$ $${\nabla ^2}({a^T}x) = 0$$

对称矩阵Ax无关,那么$$\nabla ({x^T}Ax) = 2Ax$$ $${\nabla ^2}({x^T}Ax) = 2A$$

五、从泰勒级数看待极值问题。

通过泰勒级数和极小值的定义进行判断极值点。若极值点一阶导数等于0,二阶导数大于0,为极小值。当然,如果二阶导数等于0,再判断三阶导数。

而对于向量形式的泰勒级数而言,当梯度为0时,根据Hessian矩阵的正定性来判断极值点,如果Hessian矩阵为不定矩阵,那么此点为鞍点。

六、梯度下降法

梯度下降法是一个迭代优化方法,每一次迭代都在逼近最优值(以最小值为例)。一般分为设置初始下降点,选取下降方向,确定下降步长。梯度下降法的方向选择为负梯度的方向。

以标量为例子,如果第一步计算f(x0),那么下一步计算f(x0+αd)。其中为初始点x0,α为步长,d为方向。根据只保留了1阶导数的泰勒级数f(x0+αd)=f(x0)+f'(x0)αd,那么就要保证无论的正负f'(x0)αd<=0。那么d=-f'(x0)。那么如果为矢量,则一阶导数就换成了梯度。

牛顿法中取的方向是根据保留了2阶导数的泰勒级数得到的。

拟牛顿法,因为牛顿法需要求解Hessian矩阵的逆,在实际的工程中,非常难求。拟牛顿法使用一阶导数逼近二阶导数,也就是通过梯度去逼近Hessian矩阵。

步长选择可以使用Armijo条件进行判断。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Scikit-learn是一个用于机器学习和数据挖掘的Python库,它提供了丰富的机器学习算法和工具来解决各种问题。下面是一个关于Scikit-learn机器学习算法的思维导图。 1. 监督学习算法 - 分类算法:使用已知的数据标签进行预测。包括决策树、K最近邻、朴素贝叶斯、支持向量机等。 - 回归算法:预测连续值的算法。包括线性回归、岭回归、Lasso回归等。 2. 无监督学习算法 - 聚类算法:将相似的样本分组。包括K均值聚类、层次聚类、DBSCAN等。 - 降维算法:减少数据维度。包括主成分分析、线性判别分析等。 3. 模型评估和选择 - 交叉验证:将数据集分为训练集和测试集,评估模型的性能。 - 网格搜索:通过穷举搜索参数组合来选择最佳模型。 4. 特征选择和提取 - 特征选择:选择对目标变量有用的特征。包括方差阈值、相关性等。 - 特征提取:从原始数据中创建新的特征。包括主成分分析、独立成分分析等。 5. 模型调整和优化 - 正则化:用于控制模型的复杂性。 - 参数调优:通过调整模型参数以提高性能。 6. 集成方法 - 随机森林:基于决策树的集成方法。 - AdaBoost:自适应增强方法。 7. 自然语言处理 - 文本特征提取:从文本中提取有用的特征。 - 文本分类:将文本划分为不同的类别。 Scikit-learn提供了丰富的机器学习算法和工具,可以帮助我们进行数据分析、预测和模型优化。通过使用这些算法和思维导图,我们可以更加有效地解决各种机器学习问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值