2021-07-28

最新推荐文章于 2021-08-29 19:24:16 发布

LiuBitillalala

最新推荐文章于 2021-08-29 19:24:16 发布

阅读量111

点赞数

本文链接：https://blog.csdn.net/LiuBitillalala/article/details/119192600

版权

SMALE预备役魔鬼训练营 Day3

一、上午
二、下午
三、晚上

一、上午

1.将向量下标为偶数的分量 $(x_2,x_4,\dots)$ 累加，写出相应的表达式。
表达式为 $\sum_{i\%2=0}x_i$
2.各出一道累加、累乘、积分表达式的习惯，并给出标准答案。
向量 $\mathbf{X}=\{x_1,\dots,x_n\}$ 求下标小于10的分量的和与积。
累加： $\sum_{i=1}^{10}x_i$
累乘： $\prod_{i=1}^{10}x_i$
函数 $f(x)=x^2+1$ ,写出其在 $[- 2, 2]$ 的积分表达式 $\int_{-2}^{2}(x^2+1)\mathrm{d}x$
3.给一个常用的定积分，将手算结果与程序结果对比。
常用定积分， $\int_{0}^1x\mathrm{d}x=0.5$

public static void main(String[] args) {
    double sum=0;
    double deleta=0.01;
    for (double i=0;i<1;i=i+deleta){
        sum+=i*deleta;
    }
    System.out.println("sum="+sum);
    }

运行结果

exclude patterns:
sum=0.4950000000000004

结果没有太大差距

二、下午

1.自己写一个小例子来验证最小二乘法。

时间	数量
2	4
3	5

这里的 $x_i$ 可以表示为 $\mathbf{X}=[x_{ij}]_{2\times2}$
$\begin{bmatrix} 1 & 2 \\ 1 & 3 \end{bmatrix} \quad$
$y_i$ 表示为 $\mathbf{Y}=\begin{bmatrix}4 &5\end{bmatrix}^\mathrm{T}$
$\mathbf{w}=[a,b]$
求：
$\arg\min||\mathbf{X}_{\mathbf{w}}-\mathbf{Y}||_2^2$
当 $\mathbf{w}=[2,1]$ 时 $||\mathbf{X}_{\mathbf{w}}-\mathbf{Y}||_2^2$ 最小，因此得 $\mathbf{w}$

三、晚上

1.推导
$\begin{aligned}\log L(\mathbf{w}) = \sum_{i = 1}^n \log P(y_i \vert \mathbf{x}i; \mathbf{w}) \\ = \sum_{i = 1}^n y_i \log P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w}) + (1 - y_i) \log(1 - P(y_i = 1 \vert \mathbf{x}i;\mathbf{w})) \\ = \sum_{i = 1}^n y_i \log \frac{P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w})}{1 - P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w})} + \log (1 - P(y_i = 1 \vert \mathbf{x}i; \mathbf{w}))\\ = \sum_{i = 1}^n y_i \mathbf{x}_i \mathbf{w} - \log (1 + e^{\mathbf{x}_i \mathbf{w}}) \end{aligned}$
求 $\begin{aligned} \frac{\partial \log L(\mathbf{w})}{\partial \mathbf{w}}\end{aligned}$

$\begin{aligned} \frac{\partial (y_i\mathbf{x}_i\mathbf{w})}{\partial \mathbf{w}}=y_i\mathbf{x}_i\end{aligned}$
$\begin{aligned} \frac{\partial(\log(1+e^{\mathbf{x}_i\mathbf{w}}))}{\partial \mathbf{w}}=\frac{1}{(1+e^{\mathbf{x}_i\mathbf{w}})}\end{aligned}\times \frac{\partial(e^{\mathbf{x}_i\mathbf{w}})}{\partial \mathbf{w}}$
2.特点
用于分类(特别是二分类).
运用到了点与直线的距离.
用到了激活函数，比如sigmoid，当前还可以用其它的激活函数.
用到了最大似然.
用到了向量的偏导
用到了梯度下降