暑期SMALE魔鬼训练day3

最新推荐文章于 2021-08-07 21:26:35 发布

乞讨的蚂蚁

最新推荐文章于 2021-08-07 21:26:35 发布

阅读量198

点赞数

分类专栏：暑期特训

本文链接：https://blog.csdn.net/begant/article/details/119172223

版权

暑期特训专栏收录该内容

5 篇文章 0 订阅

订阅专栏

暑期SMALE魔鬼训练day2

上午：

将向量下标为偶数的分量 $(x_2, x_4, \dots)$ 累加, 写出相应表达式.
$\sum_{i \mod 2 = 0} x_i$
各出一道累加、累乘、积分表达式的习题, 并给出标准答案.
a)函数 $f(x) = 2x^2$ 在 $x\in[1, 15]$ 时的累加和
$\sum_{x \in[1, 15]}2x^2$

sum = 0
for x in range(1, 16):
    sum = sum + 2*x**2

b). 求取 $\in [1, 100]$ 中的3的倍数累乘结果
$\mathbf{A} = \{a \in [1, 100] \vert a \mod 3 = 0\}$
$\prod_{a \in \mathbf{A}} a$

product = 1
for a in range(1, 101):
    if a % 3 == 0:
        product *= a

c)求 $\sin(x) + x$ 在[3, 8]上的积分
$\int_3^8\sin(x) + x\mathrm{d}x$

import numpy as np

x = np.linspace(3,8,10000)
y = np.sin(x) + x
dx = x[1] - x[0]                        #每个矩形的宽度
fArea = np.sum(y*dx)                    #矩形宽*高，再求和
print("Integral area:",fArea)

给一个常用的定积分, 将手算结果与程序结果对比.
$\int_1^e\frac{1}{x} + 1 \mathrm{d}x$
手动计算：
原函数为：
$\mathrm{ln}(x) + x$
带入上下限：
$\mathrm{ln}(e) + e - [\mathrm{ln}(1) + 1] = e$

代码

import numpy as np

x = np.linspace(1,np.e,10000)
y = 1/x + 1
dx = x[1] - x[0]                        #每个矩形的宽度
fArea = np.sum(y*dx)                    #矩形宽*高，再求和
print("Integral area:",fArea)
print('e:', np.e)

计算结果
在这里插入图片描述
下午：
自己写一个小例子 $(n = 3, m = 1)$ 来验证最小二乘法.

通过男性身高来大致估计体重

身高（cm）	体重(kg)
175	67
170	60
166	58

$\mathbf{X}$ 表示身高， $\mathbf{Y}$ 表示体重， $\mathbf{w}$ 表示权重
根据推导： $\mathbf{w}=(\mathbf{X}^ \mathrm{ T }\mathbf{X})^{-1}\mathbf{X}^ \mathrm{ T }\mathbf{Y}$
$\left(\left[\begin{matrix} 1 & 1 & 1 \\175 & 170 & 166\end{matrix}\right] \times \left[\begin{matrix} 1 & 175 \\ 1 & 170 \\ 1 & 166\end{matrix}\right]\right)^{-1} \times \left[\begin{matrix} 1 & 1 & 1 \\175 & 170 & 166\end{matrix}\right] \times \left[\begin{matrix}67 \\ 60 \\ 58\end{matrix}\right]$
$=\left[\begin{matrix}-111.45901693 \\ 1.01639344 \end{matrix}\right]$
将原来的数据带入
$175 \times 1.01639344 - 111.45901693 = 66.4098$
$170 \times 1.01639344 - 111.45901693 = 61.3278$
$166 \times 1.01639344 - 111.45901693 = 57.2623$

晚上：
自己推导一遍, 并描述这个方法的特点 (不少于 5 条).
对于分类目标点 $y_i \in \{0, 1\}$ ,要找到一个超平面 $w^\mathrm{T} x + b = 0$ 使得 $\mathbf{Y}$ 中的两类位于超平面的两侧。为了找到一个最优的平面，通过点到直线的距离来计算目标点与分类平面的关系。
$w^\mathrm{T} x$ 此处的 $w 和 x$ 是加上偏置 $b$ 的。由于点到超平面的距离可以取值到无穷大于是通过sigmoid函数将输出值压缩到（0， 1）之间，且可以将距离转化成概率。
$1\vert \mathrm{x};\mathrm{w}) = \frac 1{1 + e^{\mathrm{-wx}}}$
将上述式子写成一个通式
$P(y_i \vert \mathrm{x}_i;\mathrm{w}) = P(y_i = 1\vert \mathrm{x}_i;\mathrm{w})^{y_i}(1 - P(y_i =0 \vert \mathrm{x}_i;\mathrm{w}))^{1-y_i}$
对于全体对象进行优化，可以将全部的输出概率相乘，来求得使之最大的参数 $\mathrm{w}$
$\argmax_\mathrm{w}\prod_{i = 1}^nP(y_i\vert \mathrm{x}_i;\mathrm{w})$
由于连乘很难计算，所以对式子两端同时取对数
$\log L(\mathrm{w}) = \sum _{i = 1}^n\log P(y_i \vert \mathrm{x}_i;\mathrm{w})$
$\sum _{i = 1}^ny_i \log P(y_i = 1\vert \mathrm{x}_i;\mathrm{w}) + \log P(y_i =0 \vert \mathrm{x}_i;\mathrm{w}) - y_i \log P(y_i =0 \vert \mathrm{x}_i;\mathrm{w})$
带入sigmoid函数
$=\sum _{i = 1}^ny_i \mathrm{x}_i \mathrm{w} - \log (1+ e^{\mathrm{x}_i \mathrm{w}})$
最后通过梯度下降法求出 $w$ ,第 $t + 1$ 轮迭代的值
$\mathrm{w}^{t + 1} = \mathrm{w}^t -\alpha \frac {\partial \log L(\mathrm{w})} {\partial \mathrm{w}}$