2021/07/28-第三天作业

最新推荐文章于 2024-03-14 18:01:58 发布

qq_42758052

最新推荐文章于 2024-03-14 18:01:58 发布

阅读量195

点赞数

本文链接：https://blog.csdn.net/qq_42758052/article/details/119171852

版权

1. 将向量下标为偶数的分量 $x_2, x_4, …)$ 累加, 写出相应表达式.

答：表达式可以写为 $\sum_{i \mod 2=0} x_i$ ，或 $\sum_{i=1}^{\lfloor n/2 \rfloor} x_{2i}$ .

2. 各出一道累加、累乘、积分表达式的习题, 并给出标准答案.

答：给定一个向量 $\mathbf{X} = (x_1, x_2, \dots, x_n)$ ，求下标属于3到97的分量的和与乘积。
累加： $\sum_{i=3}^{97} x_i$ ，累乘： $\prod_{i=3}^{97} x_i$ .
给定一个函数 $f(x) = x^2$ ，给出其在 $[1, 7]$ 上的积分表达式。
积分表达式： $\int_1^7 x^2 \mathrm{d}x$ .

3. 你使用过三重累加吗? 描述一下其应用.

答：三重累加可以使用在，计算多个矩阵内部元素之和。

4. 给一个常用的定积分, 将手算结果与程序结果对比.

答：一个常用定积分， $\int_0^1 r\sqrt{1-r^2} \mathrm{d}r = \frac{1}{3}$ .
使用计算机计算上述定积分，代码如下，

double sum=0;
double deleta=0.01;
for(double i=0;i<1;i+=deleta)
	sum+=deleta*(i*sqrt(1-i*i));

计算结果为0.33303145522214295，与实际结果很接近。

5. 自己写一个小例子来验证最小二乘法.

答：给定数据，

时间(天)	数量(个)
1	3
2	4

令 $\mathbf{X} = \left[\begin{matrix} 1 & 1 \\ 1 & 2 \end{matrix}\right]$ ， $\mathbf{Y} = [3, 4]^\mathrm{T}$ ， $\mathbf{w} = [w_0,w_1]$ ，求 $\argmin_{\mathbf{w}} ||\mathbf{X} \mathbf{w} - \mathbf{Y}||_2^2$ 。
根据 $\mathbf{w} = (\mathbf{X}^\mathrm{T}\mathbf{X})^ {−1}\mathbf{X}^\mathrm{T}\mathbf{Y}$ ，可求得 $\mathbf{x} = [2, 1]$ ，其函数为 $f (x) = x + 2$ ，满足原数据。

6. 写出 $\mathbf{w} = (\mathbf{X}^\mathrm{T}\mathbf{X})\mathbf{X}^\mathrm{T}\mathbf{Y}$ 的推导过程.

$\begin{aligned} \|\mathbf{X}\mathbf{w} - \mathbf{Y}\|_2^2 & = (\mathbf{X}\mathbf{w} - \mathbf{Y})^{\mathrm{T}}(\mathbf{X}\mathbf{w} - \mathbf{Y}) \\ & = (\mathbf{w^{\mathrm{T}}}\mathbf{X}^{\mathrm{T}} - \mathbf{Y}^{\mathrm{T}})(\mathbf{Xw} - \mathbf{Y}) \\ & = \mathbf{w^{\mathrm{T}}X^{\mathrm{T}}Xw - w^{\mathrm{T}}X^{\mathrm{T}}Y - Y^{\mathrm{T}}Xw + Y^{\mathrm{T}}Y} \end{aligned}$ .
对上式进行求导，求导法则如下，
在这里插入图片描述
求导结果为 $\mathbf{X^{\mathrm{T}}Xw} + \mathbf{X^{\mathrm{T}}Xw} - \mathbf{X^{\mathrm{T}}Y} - \mathbf{X^{\mathrm{T}}Y} + 0 = 2\mathbf{X^{\mathrm{T}}Xw} - 2\mathbf{X^{\mathrm{T}}Y}$ ，令其等于 $0$ 有 $\mathbf{X^{\mathrm{T}}Xw} - \mathbf{X^{\mathrm{T}}Y}$ ，转换一下为 $\mathbf{w} = (\mathbf{X}^\mathrm{T}\mathbf{X})\mathbf{X}^\mathrm{T}\mathbf{Y}$ 。

7. 自己推导一遍, 并描述这个方法的特点 (不少于 5 条).

答：特点 1）将 $\mathbf{x}$ 做为参数放入 sigmoid 函数中，使用 sigmoid 函数将距离转成概率， $\vert \mathbf{x}; \mathbf{w}) = \frac{1}{1 + e^{-\mathbf{xw}}}$ .
2）使用一个式子 $P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w}) = P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w})^{y_i}(1 -P(y_i = 1 \vert \mathbf{x}_i; \mathbf{w}))^{1-y_i}$ 表示 $0$ 或 $1$ 两种情况的概率。
3）采用概率相乘的方式，对全部对象进行优化， $\argmax_\mathbf{w}L(\mathbf{w}) = \prod_{i=1}^n P(y_i \vert \mathbf{x}_i; \mathbf{w})$ .
4）使用 $\log$ 将相乘转化为相加问题， $\log L(\mathbf{w}) = \sum_{i = 1}^n \log P(y_i \vert \mathbf{x}_i; \mathbf{w})$ .
5）使用梯度下降求解 $\mathbf{w}$ ， $\mathbf{w}^{t+1} = \mathbf{w}^t - \alpha\frac{\partial\log L(\mathbf{w})}{\partial\mathbf{w}}$ .