第三天
第一次作业
-
将向量下标为偶数的分量 ( x 2 , … , x 4 ) (\textrm{x}_2, \dots,\textrm{x}_4) (x2,…,x4)累加, 写出相应表达式.
∑ i m o d 2 = 0 x i \sum_{i \mod 2 = 0} x_i imod2=0∑xi
-
各出一道累加、累乘、积分表达式的习题, 并给出标准答案.
①:
∑ i = 1 10 x i 2 + x i + 1 \sum_{i = 1}^{10} x_i^{2} + x_{i} + 1 i=1∑10xi2+xi+1
答案为:double sum = 0; for(double i = 1;i <= 10; i++) { sum += (i * i + i + 1); }
②:
∏ i = 1 2 x i 2 \prod_{i = 1}^{2} x_i^{2} i=1∏2xi2 答案为:double sum = 1; for(double i = 1;i <= 2; i++) { sum = sum * i * i; }
③:
∫ 0 10 x 2 + x d x \int_{0}^{10} x^2 + \sqrt{x} \mathrm{d}x ∫010x2+xdx 答案为:double x = 0; double deltax = 1e-2; double sum = 0; for (x = 0; x <= 10; x += deltax) { sum += ( x * x + Math.sqrt(x) )* deltax; } System.out.println(sum);
-
你使用过三重累加吗? 描述一下其应用.
三重累加等同于数学的三重积分,可以求立体的体积,和空间物体的重量。 -
给一个常用的定积分, 将手算结果与程序结果对比.
∫ 0 1 x + 1 d x \int_{0}^{1} x + 1 \mathrm{d}x ∫01x+1dx
计算机的结果为:1.4950000000000006
人算的结果为1.5
第二次作业
-
公式的推导:
arg min w ∥ X w − Y ∥ 2 2 \argmin_{\mathbf{w}} \|\mathbf{X} \mathbf{w} - \mathbf{Y}\|_2^2 wargmin∥Xw−Y∥22∥ X x − Y ∥ 2 2 = ( X w − Y ) T ( X w − Y ) \|\mathbf{X}\mathbf{x} - \mathbf{Y}\|_2^2 = \left( \mathbf{X}\mathbf{w} - \mathbf{Y} \right)^{\mathrm{T}}\left( \mathbf{X}\mathbf{w} - \mathbf{Y} \right) ∥Xx−Y∥22=(Xw−Y)T(Xw−Y)
= ( w T X T − Y T ) ( X w − Y ) =\left( \mathbf{w}^{\mathrm{T}}\mathbf{X}^{\mathrm{T}} - \mathbf{Y}^{\mathrm{T}} \right)\left( \mathbf{X}\mathbf{w} - \mathbf{Y} \right) =(wTXT−YT)(Xw−Y)
= w T X T X w − w T X T Y − Y T X w + Y T Y =\mathbf{w}^{\mathrm{T}}\mathbf{X}^{\mathrm{T}}\mathbf{X}\mathbf{w} - \mathbf{w}^{\mathrm{T}}\mathbf{X}^{\mathrm{T}}\mathbf{Y} - \mathbf{Y}^{\mathrm{T}}\mathbf{X}\mathbf{w}+ \mathbf{Y}^{\mathrm{T}}\mathbf{Y} =wTXTXw−wTXTY−YTXw+YTY -
对优化目标求导:
∂ ( ∥ X w − Y ∥ 2 2 ) = 2 X T X w − X T Y − X T Y \partial (\|\mathbf{X}\mathbf{w} - \mathbf{Y}\|_2^2) = 2\mathbf{X}^{\mathrm{T}}\mathbf{X}\mathbf{w} - \mathbf{X}^{\mathrm{T}}\mathbf{Y} - \mathbf{X}^{\mathrm{T}}\mathbf{Y} ∂(∥Xw−Y∥22)=2XTXw−XTY−XTY
= 2 X T X w − 2 X T Y = 2\mathbf{X}^{\mathrm{T}}\mathbf{X}\mathbf{w} - 2\mathbf{X}^{\mathrm{T}}\mathbf{Y} =2XTXw−2XTY令其为0,可以得到:
w = ( X T X ) − 1 X T Y \mathbf{w} = (\mathbf{X}^\mathrm{T}\mathbf{X})^{-1}\mathbf{X}^\mathrm{T}\mathbf{Y} w=(XTX)−1XTY -
最小二乘法
X = [ 1 2 3 ] \mathbf{X} = \begin{bmatrix} 1 \\ 2\\ 3 \end{bmatrix} X=⎣⎡123⎦⎤Y = [ 3 6 9 ] \mathbf{Y} = \begin{bmatrix} 3 \\ 6\\ 9 \end{bmatrix} Y=⎣⎡369⎦⎤
w = ( X T X ) − 1 X T Y \mathbf{w} = (\mathbf{X}^\mathrm{T}\mathbf{X})^{-1}\mathbf{X}^\mathrm{T}\mathbf{Y} w=(XTX)−1XTY
= ( [ 1 2 3 ] [ 1 2 3 ] ) − 1 [ 1 2 3 ] [ 3 6 9 ] = \left(\begin{bmatrix} 1 & 2 & 3 \end{bmatrix} \begin{bmatrix} 1 \\ 2\\ 3 \end{bmatrix} \right)^ {-1} \begin{bmatrix} 1 & 2 & 3 \end{bmatrix} \begin{bmatrix} 3 \\ 6\\ 9 \end{bmatrix} =⎝⎛[123]⎣⎡123⎦⎤⎠⎞−1[123]⎣⎡369⎦⎤= 1 14 × 42 =\frac{1}{14} \times 42 =141×42
≈ 1.93 \approx 1.93 ≈1.93
第三次作业
问题:自己推导一遍, 并描述这个方法的特点 (不少于 5 条).
1.适用于二分类问题
2.使用sigmoid函数,将点到超平面的距离转换为概率。使得计算损失时可导。
3.优化目标表达式为一般性,直接涵盖两种分类的结果。利于建立统一的优化目标。
4.用log函数将乘积运算转为加法运算,方便了计算。
5.对所有对象进行优化。
6.采用梯度下降求参。