CQF笔记Primer数学基础

最新推荐文章于 2023-05-31 23:44:25 发布

G G

最新推荐文章于 2023-05-31 23:44:25 发布

阅读量1.7k

点赞数 6

分类专栏： CQF

本文链接：https://blog.csdn.net/weixin_42859140/article/details/106227595

版权

CQF 专栏收录该内容

13 篇文章 38 订阅

订阅专栏

CQF笔记Primer数学基础

1 Calculus 微积分

1.1 Basic Terminology 基本术语

符号	含义	符号	含义	符号	含义
$\exists$	存在	$\rightarrow$	给定	$\equiv$	等价于
$\forall$	对所有……有	s.t.	such that	$\sim$	similar
$\therefore$	所以	:	such that	$\in$	是……的元素
$\because$	因为	iff	当且仅当	!x	有唯一的x

1.2 Functions 函数

输入到输出的映射 mapping：

input记作x，independent variable，自变量
output记作y，dependent variable，因变量

mapping 映射：

一对一
多对一
一对多（不是函数）

函数的定义：每个x映射到唯一的一个y

inverse function 逆函数

一对一映射的函数有反函数
多对一映射的函数没有反函数，限制自变量的值域，变成一对一映射

函数 $y = 2x^2 - 1$ 的逆函数（限制x的取值范围为 $\ge 0$ ）为
$\sqrt{\frac{x+1}{2}}$

$f(f^{-1}(x)) = x$
$f^{-1}(f(x)) = x$

even function偶函数和 odd function 奇函数

偶函数

$f (- x) = f (x)$
沿y轴对称

奇函数

$f (- x) = f (- x)$
中心对称（沿原点旋转180°）

大部分函数不是偶函数或者奇函数，但是可以表达为奇函数和偶函数之和

1.2.1 Explicit/Implicit Representation 显示/隐式表示

显示表示 $y = 2x^2 + 4x - 16 = 0$
隐式表示 $f (x, y) = 0$

1.2.2 Types of function

Polynomials 多项式

$\sum_{k=0}^{n} a_k x^k, \ 其中a_0, a_1, ..., a_n是常数$

K = 1称为线性项
K = 2称为二次项

二次多项式 $ax^2 + bx + c = 0$ 的解
$\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}$

三种情况：

$b^2 - 4ac > 0 \rightarrow x_1 \neq x_2，两个实数根$
$b^2 - 4ac = 0 \rightarrow x_1 = x_2 = - \frac{b}{2a} 为实数$
$b^2 - 4ac < 0 \rightarrow x_1 \neq x_2，两个复数共轭根$

Modulus 模（绝对值）

$\begin{cases} x& \text{x>0}\\ -x& \text{x<0} \end{cases}$

模函数是分段函数piecewise function

1.3 Limit 极限

研究逼近问题

$\lim_{x \to x_0} f(x) \rightarrow l$

同时从左边逼近和从右边逼近，应该相同逼近同一个值

普通极限

$\begin{aligned} & \lim_{x \to \infty} \frac{x^2 + 2x + 2}{3x^2 + 4} \\ = & \lim_{x \to \infty} \frac{1 + \frac{2}{x} + \frac{2}{x^2}}{3 + \frac{4}{x^2}} \\ = & \frac{1}{3} \end{aligned}$

函数连续

$\lim_{x \to x_0} f(x) = f(x_0)$

1.3.1 exponential and log functions 指数和对数函数

$y = a^x \\ y = \log_a x$

以自然对数为底的指数函数和对数函数
$y = e^x \\ y = ln\ x \\ y = log\ x$

$\lim_{n \to \infty} (1 + \frac{x}{n})^n$

正态分布的形式类似于 $e^{-x^2 / 2}$

1.3.2 Trigonometric/Circular Functions 三角函数

sin 正弦函数

奇函数 $s i n (- x) = - s i n (x)$
周期函数 $\pi) = sin(x)$
$\Leftrightarrow x = n \pi \ \forall n \in Z$
$D o m (s i n x) = R$ and $I m (s i n x) = [- 1, 1]$

cos 余弦函数

偶函数 $c o s (- x) = c o s (x)$
周期函数 $\pi) = cos(x)$
$\Leftrightarrow x = (2n + 1) \frac{\pi}{2} \ \forall n \in Z$
$Dom(cos\ x) = R$ and $\ x) = [-1, 1]$

tan 正切函数

偶函数 $t a n (- x) = t a n (x)$
周期函数 $\pi) = cos(x)$
$Dom(tan\ x) = \{x : cos \ x \neq 0\} = \{x : x \neq (2n + 1) \frac{\pi}{2}; \ (n \in Z) \} = R - \{x = (2n + 1) \frac{\pi}{2}; \ (n \in Z) \}$

三角函数关系式
$cos^2 x + sin^2 x = 1 \\$

$\pm y) = sinx \ cosy \mp cosx \ siny \\ cos(x \pm y) = cosx \ cosy \mp sinx \ siny \\ tan(x \pm y) = \frac{tanx \pm tany}{1 \mp tanx \ tany} \\$

$\frac {1} {cosx} \\ cscx = \frac {1} {sinx} \\ cotx = \frac {1} {tanx} \\$

$sin^{-1}x \rightarrow arcsin(x) \\ cos^{-1}x \rightarrow arccos(x) \\ tan^{-1}x \rightarrow arctan(x) \\$

$\lim_{x \to 0} sinx = 0 \\ \lim_{x \to 0} \frac{sinx}{x} = 1 \\ \lim_{x \to 0} |x| = 0 \\ \lim_{x \to 0} \frac{|x|}{x} 的左右极限分别为-1和1，因此没有极限 \\$

1.3.3 Hyperbolic Functions 双曲函数

$\ x = \frac{1}{2}(e^x-e^{-x})$

奇函数
$\ x) = R$ and $\ x) = R$

$\ x = \frac{1}{2}(e^x+e^{-x})$

偶函数
$Dom(cosh\ x) = R$ and $Im(cosh\ x) = [1, \infty)$

$\ x = \frac{sinhx}{coshx}$

奇函数
$Dom(cosh\ x) = R$ and $Im(cosh\ x) = (1, 1)$

关系式

$\begin{aligned} cosh^2 x - sinh^2 x & = 1\\ sinh(x \pm y) & = sinhx \ coshy \pm sinhx \ coshy \\ consh(x \pm y) & = coshx \ coshy \pm sinhx \ sinhy \\ \end{aligned}$

反函数

$\begin{aligned} sinh^{-1}x & = ln \left| x + \sqrt {x^2 + 1} \right| \\ cosh^{-1}x & = ln \left| x + \sqrt {x^2 - 1} \right| \\ tanh^{-1}x & = \frac{1}{2} ln \left| \frac{1+x}{1-x} \right| \\ \end{aligned}$

1.4 Differentiation 微分

莱布尼兹表示
$\frac{df}{dx}$
格朗日表示
$f^{'} (x)$

定义

$\lim_{\delta x \to 0} \frac{f(x + \delta x) - f(x)}{\delta x}$

上述定义式为前向微分

反向微分
$\lim_{\delta x \to 0} \frac{f(x) - f(x - \delta x)}{\delta x}$
中心微分
$\lim_{\delta x \to 0} \frac{f(x + \delta x) - f(x - \delta x)}{2 \delta x}$

求微分的例子： $f(x) = x^3$

$\begin{aligned} f'(x) & = \lim_{\delta x \to 0} \frac{f(x + \delta x) - f(x)}{\delta x} \\ & = \lim_{\delta x \to 0} \frac{(x + \delta x)^3 - x^3}{\delta x} \\ & = \lim_{\delta x \to 0} \frac{(x^3 + 3 x^2 \delta x + 3x \delta x ^ 2 + \delta x ^ 3) - x^3}{\delta x} \\ & = \lim_{\delta x \to 0} (3x^2 + 3x\delta x + \delta x ^2) \\ & = 3x^2 \\ \end{aligned}$

常用微分

$\frac{d}{dx} x^n = nx^{n-1} \\ \frac{d}{dx} e^x = e^x \\ \frac{d}{dx} e^{ax} = ae^{ax} \\ \frac{d}{dx} logx = \frac{1}{x} \\ \frac{d}{dx} sinx = cosx \\ \frac{d}{dx} cosx = -sinx \\ \frac{d}{dx} tanx = sec^2 x \\$

Linearity 线性：

线性的定义

$\times f(x) = c \times Op(f(x))$
$\pm g(x)) = Op(f(x)) \pm Op(g(x))$

两个函数加权和的微分，等于两个函数微分的加权和
$\lambda f(x) + \mu g(x), \lambda和\mu是常量 \\ \frac{dy}{dx}=\frac{d}{dx} ( \lambda f(x) + \mu g(x))= \lambda f'(x) + \mu g'(x)$

1.4.1 Product Rule 乘法法则

对两个函数的乘积求导数

$\times g(x) \Longrightarrow \frac{dy}{dx} = f'(x) \times g(x) + f(x) \times g'(x)$

1.4.2 Function of a Function Rule 函数的函数法则

求函数的函数的导数：chain rule 链式求导法则

$\Longrightarrow \frac{dy}{dx} = f'(g(x)) \times g'(x)$

$\frac{dy}{dx} = \frac{dy}{du} \times \frac{du}{dx}$

1.4.3 Quotient Rule 商数法则

可以用乘法法则推导

$\frac{f(x)}{g(x)} \Longrightarrow \frac{dy}{dx} = \frac{f'(x) \times g(x) - f(x) \times g'(x)}{((g(x))^2}$

1.4.4 Implicit Differentiation 隐式微分

$a^x \\ lny = xln \ a \\ \frac{1}{y} \frac{dy}{dx} = ln \ a \\ \frac{dy}{dx} = a^x ln \ a$

1.4.5 Higher Derivatives 高阶导数

n次多项式的 n+1 阶导数为0
不是所有函数都处处可导

1.4.6 Leibniz Rule 莱布尼兹法则

乘法法则的高阶表示（二项式）
$D^n(uv) = \sum_{i=0}^{n} C_n^i \times D^i u \times D^{n-i}v, \ C_n^r = \frac{n!}{r!((n-r)!}$

1.4.7 Further Limits 高阶极限

L’Hospital’s rule

$\lim_{x \to a} \frac{f(x}{g(x)} \equiv \frac{0}{0} \ or \ \frac{\infty}{\infty}$
对极限的上下两部分同时求导，计算极限

$\lim_{x \to a} \frac{f(x}{g(x)} = \lim_{x \to a} \frac{f'(x}{g'(x)} = … = \lim_{x \to a} \frac{f^{(r)}(x}{g^{(r)}(x)}$

$\lim_{x \to 0} \frac{sinx}{x} = \lim_{x \to 0} \frac{cosx}{1} =1 \\$

1.5 Taylor Series 泰勒级数

多项式函数逼近原始函数，N次项的系数为N次导数

对于 $f(x)=e^x$ , $f^{(r)}(x) = e^x$ , $f^{(r)}(0) = 1$

线性近似：
截距项为1，斜率为1， $e^x \approx 1 + x$

二次近似：
$g(x)=ax^2+bx+c \\ g'(x)=2ax+b \\ g''(x)=2a$
令 $g (0) = f (0), g^{'} (0) = f^{'} (0), g^{''} (0) = f^{''} (0)$
得到 $a=\frac{1}{2}$
因此 $e^x \approx 1 + x + \frac{1}{2} x^2$

三次近似: $e^x \approx 1 + x + \frac{1}{2} x^2 + \frac{1}{6} x^3$

无穷展开： $e^x = \sum_{n=0}^{\infty} \frac{x^n}{n!}$

泰勒级数: $f (x)$ 在 $x_0$ 的泰勒展开
$\sum_{n=0}^{\infty} \frac{1}{n!} f^{(n)}(x_0) \ (x-x_0)^n$

常用展开
$e^x = \sum_{n=0}^{\infty} \frac{x^n}{n!} \\ log(1+x)= \sum_{n=0}^{\infty} (-1)^{n-1} \frac{x^n}{n!} \\$

泰勒定量

$\begin{aligned} & f(x) = \sum_{k=0}^{n-1} \frac{1}{k!} f^{(k)}(x_0) \ (x-x_0)^k + R_n(x) \\ 其中 & R_n(x) = \frac{1}{n!} \ f^{(n)}(\xi) \ (x-x_0)^n \\ & \xi是介于x_0和x之间的某个未知数值 \end{aligned}$

用泰勒展开式计算极限
$\begin{aligned} \lim_{x \to 0} \frac{sin \ x}{x} & \sim \lim_{x \to 0} \frac{\sum_{i=0}^{\infty} (-1)^{i} \frac{x^{2i+1}}{(2i+1)!}}{x} \\ & \sim \lim_{x \to 0} \sum_{i=0}^{\infty} (-1)^{i} \frac{x^{2i}}{(2i+1)!} \\ & \sim \lim_{x \to 0} (1 - \frac{x^2}{3!} + \frac{x^4}{5!} + …) \\ & = 1 \end{aligned}$

1.5.1 The Binomial Expansion 二项式展开

二项式展开是 $1+x)^n$ 的泰勒展开式

$\begin{aligned} (1+x)^n & = \sum_{k=0}^n \frac{n!}{k! \ (n-k)!} x^k \\ (1+ax)^n & = \sum_{k=0}^n \frac{n!}{k! \ (n-k)!} (ax)^k \\ (p+ax)^n &= (p(1 + \frac{a}{p}x))^n\\ & = p^n \sum_{k=0}^n \frac{n!}{k! \ (n-k)!} (\frac{a}{p}x)^k\\ \end{aligned}$

Pascal三角形： $1+x)^n$ ，不同的n的二项式系数组成的三角形

1.6 Integration 积分

1.6.1 The Indefinite Integral 不定积分

$f (x)$ 的不定积分 $\int f(x)dx$

$F(x)=\int f(x)dx \\ \frac {dF(x)}{dx} = f(x)$

$y = 2 x$ , $\frac{dy}{dx}=2$ , $\int 2dx = 2x +C$ , 注意常数项C对x的微分为0

不定积分的例子
$\begin{aligned} \int x^n dx & = \frac{1}{n+1} x^{n+1} + C, \ (n \neq -1) \\ \int \frac{1}{x} dx & = ln(x) + C \\ \int e^{ax} dx & = \frac{1}{a} e^{ax} + C \\ \int cos(ax)dx & = \frac{1}{a}sin(ax) + C \\ \int sin(ax)dx & = -\frac{1}{a}cos(ax) + C \\ \end{aligned}$

Linearity 线性：积分是线性的
$\int (\alpha f(x) + \beta g(x))dx = \alpha \int f(x)dx + \beta \int g(x)dx$

$\int (A x^2 + B x^4)dx = A \int x^2 dx + B \int x^3 dx = \frac{A}{3} x^3 \frac{B}{4} x^4 + C \\ \int (3 e^x + \frac{2}{x})dx = 3 \int e^x dx + 2 \int \frac{1}{x} dx = 3e^x + 2lnx + C$

1.6.2 The Definite Integral 定积分

$f (x)$ 的定积分 $\int_a^b f(x)dx$

例子:
$\int _{-1}^{1} e^x dx = e^x | _{-1}^{1} = e - \frac{1}{e}$

$\int_a^x f(x)dx$ 这种表示法，容易造成混淆，应使用哑变量

$\int_a^c f(x)dx = \int_a^b f(x)dx + \int_b^c f(x)dx$ , if $a < b < c$

$\int_a^c f(x)dx = - \int_c^a f(x)dx$

1.6.3 Integration by Substitution 代换积分法/换元法

$\int g(f(x))f'(x)dx$

反向使用链式法则：
令 $z = f (x)$
则 $可得\int g(f(x))f'(x)dx = \int g(z)dz$

例子： $\int_1^2 e^{x^2}2xdx$ ,
令 $z=x^2$ ,
可得 $\int_1^2 e^{x^2}2xdx = \int_1^4 e^zdz = e^z | _1^4 = e^4-e^1$

重要例子： $\int_{-\infty}^{\infty} e^{-x^2}dx$
标准正态分布 $\frac{1}{\sqrt{2 \pi}}e^{-\frac{x^2}{2}}$
标准正态分布的CDF $\int_{-\infty}^{\infty} Z(x)dx = \frac{1}{\sqrt{2 \pi}}\int_{-\infty}^{\infty} e^{-\frac{s^2}{2}}ds = 1$
令 $x=\frac{s}{\sqrt{2}}$
可得 $\int_{-\infty}^{\infty} e^{-x^2}dx = \sqrt{\pi}$

奇函数和偶函数的积分：
$\begin{aligned} \int_{-a}^{a} f(x)dx & = \int_{-a}^{0} f(x)dx + \int_{0}^{a} f(x)dx \\ & = -\int_{0}^{-a} f(x)dx + \int_{0}^{a} f(x)dx \\ & = \int_{0}^{a} f(-x)dx + \int_{0}^{a} f(x)dx \\ & = \begin{cases} 2 \int_{0}^{a} f(x)dx & \text{f(x)是偶函数}\\ 0 & \text{f(x)是奇函数} \end{cases} \end{aligned}$

1.6.4 Integration by Parts 分部积分法

$\int u'vdx$

反向使用乘法法则
$\int u'vdx = uv - \int uv'dx + C$

分部积分法的使用场景：v是多项式函数，u是指数函数

例子： $\int xe^xdx$
令： $v=x, v'=1, u=e^x, u'=e^x$
得到： $\int xe^xdx = uv - \int uv'dx + C = xe^x - \int e^x \times 1dx = e^x(x-1) + C$

弱国多项式部分的次数大于1，反复使用分部积分法直到变为0次

经典问题： $\int e^x sinx dx$
令 $v=e^x, u'=sinx, v'=e^x, u=-cosx$
得到： $\int e^x sinx dx = -e^xcosx + \int e^x cosx dx$
令 $v=e^x, u'=cosx, v'=e^x, u=sinx$
得到： $\int e^x cosx dx = e^xsinx - \int e^x sinx dx$
将上两个等式相加，消去 $\int e^x cosx dx$ 项得到
$\int e^x sinx dx=\frac{1}{2}e^x(sinx-cosx)$
$\int e^x cosx dx=\frac{1}{2}e^x(sinx+cosx)$

1.6.5 Reduction Formula 约化公式

$\int_{0}^{\infty} e^{-t}t^ndt = I_n$

用部分积分法逐次消去多项式项，得到 $I_n = n!I_0$ , 注意 $e^{-t}t^n|_{0}^{\infty}=0$
$I_0 = \int_{0}^{\infty} e^{-t}dt = 1$ , $I_n = n!$
$I_n$ 称为Gamma函数（ $\Gamma$ 函数）

1.6.6 Other Results 其他法则

$\int \frac{f'(x)}{f(x)} = ln|f(x)| +C$
$\int \frac{1}{a+bx} = \frac{1}{b}ln|a+bx| + C$

Partial Fractions:部分分式分解
$\frac{f(x)}{g(x)} = \frac{\sum_{n=0}^{N} a_n x^n}{\sum_{n=0}^{M} b_n x^n}$

如果N<M，则h(x)称为部分分式分解

$\frac{c}{(x+a)(x+b)} \equiv \frac{A}{x+a} + \frac{B}{x+b} \\ c = A(x+b) + B(x+a)$
求解出A和B，得到部分分式分解

重复的因式：
$\frac{c}{(x+a)^2(x+b)^3} = \frac{A}{x+a} + \frac{B}{(x+a)^2} + \frac{C}{x+b} + \frac{D}{(x+b)^2} + \frac{E}{(x+b)^3}$
未分解的高次项
$\frac{2x+1}{(x^2+3x+2)(x-1)} = \frac{Ax+B}{x^2+3x+2} + \frac{C}{x-1}$

1.7 Complex Numbers 复数

复数的定义
$z = x + i y$ where $\in R$ and $\sqrt{-1}$
$x$ 称为实部real part, $y$ 称为虚部imaginary part

极坐标表示形式 $r(cos\theta + i \ sin\theta)$
$\ cos\theta, \ y =r \ sin\theta), \ \theta = arctan \frac{y}{x}$

在这里插入图片描述
共轭conjugate
$z = x + i y$ 和 $z = x - i y$ 互为共轭复数

1.7.1 Arithmetic 算术运算

加减法： $z_1 \pm z_2 = (x_1 \pm x_2) + i(y_1 \pm y_2))$
乘法： $z_1 \times z_2 = (x_1 x_2 - y_1 y_2) + i(x_1 y_2 + x_2 y_1)$
除法： $\frac{z_1}{z_2} = \frac{1}{x_2 ^ 2 + y_2 ^ 2} ((x_1 x_2 + y_1 y_2) + i(x_1 y_2 - x_2 y_1))$
除法相当于上下都乘以 $z_2$ 的共轭复数 $x_2 - i \ y_2$

1.7.2 Complex Conjugate Identities 共轭复数的性质

共轭的共轭 $\overline {(\bar z)} = z$
加法的共轭 $\overline {(z_1 + z_2)} = \overline {z_1} + \overline {z_2}$
乘积的共轭 $\overline {(z_1 \times z_2)} = \overline {z_1} \times \overline {z_2}$
共轭相加 $\bar z = 2x = 2 Re \ z \\ Re \ z = \frac{z + \bar z}{2}$
共轭相减 $\bar z = 2iy = 2i Im \ z \\ Im \ z = \frac{z - \bar z}{2i}$
共轭相乘 $\times \bar z = (x + iy)(x - iy) = |z|^2$

1.7.3 Polar Form 极坐标形式

$\theta + i \ sin\theta) = re^{i \theta} \\ e^{i \theta} = cos \theta + i \ sin\theta$

极坐标形式的乘除法非常简便

Euler’s Formula 欧拉公式

可以通过泰勒级数证明 $e^{i \theta} = cos \theta + i \ sin\theta$ ，关键点在于 $i^2=-1$

泰勒展开式
$\begin{aligned} e^x & = \sum_{n=0}^{\infty} \frac{x^n}{n!} \\ sin \ x & = \sum_{n=0}^{\infty} (-1)^n \frac{x^{(2n+1)}}{(2n+1)!} \\ cos \ x & = \sum_{n=0}^{\infty} (-1)^n \frac{x^{(2n)}}{(2n)!} \\ \end{aligned}$

欧拉公式的证明
$\begin{aligned} e^{i \theta} & = \sum_{n=0}^{\infty} \frac{(i \theta)^n}{n!} \\ & = \sum_{n=0}^{\infty} \frac{(i \theta)^{(2n)}}{(2n)!} + \sum_{n=0}^{\infty} \frac{(i \theta)^{(2n+1)}}{(2n+1)!} \\ & = \sum_{n=0}^{\infty} \frac{i^{(2n)} \theta^{(2n)}}{(2n)!} + \sum_{n=0}^{\infty} \frac{i \times i^{(2n)} \theta^{(2n+1)}}{(2n+1)!} \\ &= \sum_{n=0}^{\infty} (-1)^n \frac{x^{(2n)}}{(2n)!} + i \sum_{n=0}^{\infty} (-1)^n \frac{x^{(2n+1)}}{(2n+1)!} \\ &= cos \theta + i sin \theta \\ \end{aligned}$

用欧拉公式计算 $\int e^x sinx dx$
$\begin{aligned} \int e^x sinx dx & = \int e^x Im e^{ix} dx \\ & = \int Im e^{(1 + i)x} dx \\ & = Im \frac{1}{1+i}e^{(1 + i)x} dx \\ & = e^x Im \frac{1-i}{2}e^{ix} dx \\ & = \frac{1}{2} e^x Im (1 - i)(cosx+isinx) \\ & = \frac{1}{2} e^x (sinx - cosx) \end{aligned}$

同样的方法可以得到 $\int e^x sinx dx = \frac{1}{2} e^x (sinx + cosx)$

1.8 Functions of Several Variables: Multivariate Calculus 多变量函数：多变量微积分

偏微分 partial derivative
对 $f (x, y)$ 定义偏微分
$\frac {\partial f}{\partial x} = lim_{\delta x \to 0} \frac{f(x + \delta x, y) - f(x, y)}{\delta x}$
其中y保持不变（看作常量）
偏微分也记作 $f_x, \ f_y$

高阶偏微分
$\frac {\partial ^2 f}{\partial x^2} = f_{xx} = \frac {\partial}{\partial x} (\frac {\partial f}{\partial x}) \\ \frac {\partial ^2 f}{\partial y^2} = f_{yy} = \frac {\partial}{\partial y} (\frac {\partial f}{\partial y}) \\ \frac {\partial ^2 f}{\partial x \partial y} = f_{xy} = \frac {\partial}{\partial y} (\frac {\partial f}{\partial x}) \\ \frac {\partial ^2 f}{ \partial y \partial x} = f_{yx} = \frac {\partial}{\partial x} (\frac {\partial f}{\partial y}) \\$

1.8.1 The Chain Rule I 链式法则I

单变量:
$\ u=g(x) \\ \frac{df}{dx} = \frac{df}{du} \times \frac{du}{dx}$

多变量: 多个变量都是某个最终变量的函数
$\ x=x(s), \ y=y(s) \\ \frac{df}{ds} = \frac{\partial f}{\partial x} \times \frac{dx}{ds} + \frac{\partial f}{\partial y} \times \frac{dy}{ds}$

1.8.2 The Chain Rule II 链式法则II

多变量: 多个变量都是某一组最终变量的函数
$\ x=x(u,v), \ y=y(u,v) \\ \frac{df}{du} = \frac{\partial f}{\partial x} \times \frac{\partial x}{\partial u} + \frac{\partial f}{\partial y} \times \frac{\partial y}{\partial u}$

1.8.3 Taylor for two Variables 两变量泰勒展开

$f (x, t)$ 在 $x=x_0, \ t=t_0$ 处展开

$\begin{aligned} f(x) = & f(x_0, t_0) \\ & + f_x(x_0, t_0)(x - x_0) + f_t(x_0, t_0)(t - t_0) \\ & + \frac{1}{2} \left\{ \begin{aligned} & f_{xx}(x_0, t_0)(x - x_0)^2 \\ & + 2f_{xt}(x_0, t_0)(x - x_0)(t - t_0) \\ & + f_{tt}(x_0, t_0)(t - t_0)^2 \\ \end{aligned} \right\} \\ & + \dots \end{aligned}$

2 Linear Algebra 线性代数

2.1 Properties of Vectors 向量的性质

n维空间 $R_n$
n维向量
$\vec \boldsymbol v = \left[ \begin{matrix} v_1 \\ v_2 \\ \vdots \\ v_n \\ \end{matrix} \right] \in R_n$
$v_i, \ (i = 1, 2, \cdots, n)$ 是向量 $v$ 的第i个维度

2.1.1 Vector Arithmetic 向量算术

相同维度的向量和
$\vec \boldsymbol u + \vec \boldsymbol v = \left[ \begin{matrix} u_1 + v_1 \\ u_2 + v_2 \\ \vdots \\ u_n + v_n \\ \end{matrix} \right]$

向量和标量的乘法

$\vec \boldsymbol v = \left[ \begin{matrix} kv_1 \\ kv_2 \\ \vdots \\ kv_n \\ \end{matrix} \right]$

向量点积

$\vec \boldsymbol u . \vec \boldsymbol v = \sum_{i=1}^{n} u_i v_i$

$\vec \boldsymbol u . \vec \boldsymbol v = \vec \boldsymbol v . \vec \boldsymbol u$

2.1.2 Concept of Length in $R_n$ n维空间中的向量长度

向量长度
$|\vec \boldsymbol u | = \sum_{i=1}^{n} u_i^2 \\ \vec \boldsymbol u = |\vec \boldsymbol u | \hat{\vec \boldsymbol u} \\ \hat{\vec \boldsymbol u}= \frac{\vec \boldsymbol u }{|\vec \boldsymbol u | } \\ |\hat{\vec \boldsymbol u}| = 1$

$\hat{\vec \boldsymbol u}$ 是单位向量，反映向量的方向

向量距离
$|\vec \boldsymbol u - \vec \boldsymbol v| = \sum_{i=1}^{n} (u_i - v_i)^2$

向量 $\vec \boldsymbol u$ 长度也叫L2 norm/欧几里得norm： $\left \| \vec \boldsymbol u \right \| = \sum_{i=1}^{n} u_i^2$

L2距离/欧几里得距离： $\left \| \vec \boldsymbol u - \vec \boldsymbol v \right \| = \sum_{i=1}^{n} (u_i - v_i)^2$

余弦夹角

$\vec \boldsymbol u . \vec \boldsymbol v = |\vec \boldsymbol u| |\vec \boldsymbol v| cos \theta \\ \rightarrow cos \theta = \frac{\sum_{i=1}^{n} u_i v_i}{ |\vec \boldsymbol u| |\vec \boldsymbol v|} \\$

余弦夹角可以理解为两个向量的归一化距离

向量正交：

两个向量的点积为0， $\vec \boldsymbol u . \vec \boldsymbol v=0$
向量夹角为90°

2.2 Matrices 矩阵

$\boldsymbol A_{m \times n}$ 表示m行n列的矩阵
$\boldsymbol A = \left[ \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{matrix} \right] \\ \boldsymbol A = (a_{ij}) \ for \ i = 1,2, \cdots, m; \ j = 1, 2, \cdots, n$

2.2.1 Matrix Arithmetic 矩阵算术

矩阵加法 : 对应元素相加

交换律 $\boldsymbol A + \boldsymbol B = \boldsymbol B + \boldsymbol A$

2.2.2 Matrix Multiplication 矩阵乘法

矩阵乘法： $\boldsymbol C_{pm} = \boldsymbol A_{pn} \boldsymbol B_{nm}$
A的列数和B的行数应该相同

$\boldsymbol C_{ij} = \vec{\boldsymbol A_i} . \vec{\boldsymbol B_j} = \sum_{k=1}^N \boldsymbol A_{ik} \boldsymbol B_{kj}$

2.2.3 Transpose 转置

矩阵的行列交换

${(\boldsymbol A+\boldsymbol B)}^T = {\boldsymbol A}^T + {\boldsymbol B}^T \\ {({\boldsymbol A}^T)}^T = \boldsymbol A \\ {(k \boldsymbol A)}^T = k {\boldsymbol A}^T \\ {(\boldsymbol A \boldsymbol B)}^T = {\boldsymbol B}^T {\boldsymbol A}^T \\$

skew symmetric matrix 斜对称矩阵 : $\boldsymbol A + {\boldsymbol A}^T = 0; a_{ii}=0, a_{ij} = -a_{ji}$

2.2.4 Matrix Representation of Linear Equations 线性方程组的矩阵表达形式

线性方程组
$\left\{ \begin{aligned} ax + by = p \\ cx + dy = q \\ \end{aligned} \right.$

当 $\neq 0$ 时，方程组有唯一解

$\left\{ \begin{aligned} x = \frac{dp - bq}{ad - bc} \\ y = \frac{aq - cp}{ad - bc} \\ \end{aligned} \right.$

当 $a d - b c = 0$ 时，可能无解，也可能有无穷多解

矩阵表示
$\left[ \begin{matrix} a & b \\ c & d \\ \end{matrix} \right] \times \left[ \begin{matrix} x \\ y \\ \end{matrix} \right] = \left[ \begin{matrix} p \\ q \\ \end{matrix} \right] \\ \boldsymbol A \vec \boldsymbol x = \vec \boldsymbol p$

行列式 determinant
$\left| \begin{matrix} a & b \\ c & d \\ \end{matrix} \right| = ad - bc$

方阵行列式不为0，表示矩阵可逆

单位阵 identity matrix
$\left| \begin{matrix} 1 & 0 & 0 & \cdots & 0 \\ 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ \end{matrix} \right| = ad - bc$

$\boldsymbol I \boldsymbol A = \boldsymbol A \boldsymbol I = \boldsymbol A$

三对角矩阵(Tridiagonal Matrices)

三对角矩阵
从右到左三条对角线分别是：super、main、sub

2.3 Using Matrix Notation For Solving Linear Systems 矩阵术语

线性方程组
$\left\{ \begin{aligned} ax + by + cz = p \\ dx + ey + fz = q \\ gx + hy + iz = r \\ \end{aligned} \right.$

$\left[ \begin{matrix} a & b & c \\ d & e & f \\ g & h & i \\ \end{matrix} \right] \times \left[ \begin{matrix} x \\ y \\ z \\ \end{matrix} \right] = \left[ \begin{matrix} p \\ q \\ r \\ \end{matrix} \right] \\ \boldsymbol A \vec \boldsymbol x = \vec \boldsymbol p$

$\boldsymbol A$ 是系数矩阵

增广矩阵 augmented matrix
$\left [ \begin{array}{c|c} \begin{matrix} a & b & c \\ d & e & f \\ g & h & i \\ \end{matrix} & \begin{matrix} p \\ q \\ r \\ \end{matrix} \end{array} \right ]$

行阶梯形式 echelon form，对增广矩阵化简，对角线以下部分全部是0

矩阵行操作（对方程组的解没有影响）

$ER_1]$ : 行交换
$ER_2]$ : 行乘以系数k
$ER_3]$ : 行加上其他行乘以系数k

通过行操作将增广矩阵变换为行阶梯形式

2.4 Matrix Inverse 逆变换

$\boldsymbol A \boldsymbol A^ {-1} = \boldsymbol A^ {-1} \boldsymbol A = I$

$\boldsymbol A \vec \boldsymbol x = \vec \boldsymbol p \rightarrow \boldsymbol x = \boldsymbol A^ {-1} \vec \boldsymbol p$

$\left( \begin{matrix} a & b \\ c & d \\ \end{matrix} \right) ^ {-1} = \frac{1}{ad-bc} \left( \begin{matrix} d & -b \\ -c & a \\ \end{matrix} \right), \ ad-bc \neq 0$

用行列式计算逆矩阵

$\boldsymbol A^ {-1} = \frac{1}{|\boldsymbol A|} adj\ \boldsymbol A \\ adj\ \boldsymbol A = [ (-1)^{i+j} |\boldsymbol M_{ij}|]^T$
$(-1)^{i+j} \boldsymbol M_{ij}$ 是行列式的余子式cofactor，从矩阵A去掉i行j列剩下的部分组成的矩阵，

行列式计算规则：

$[ER_1]: R_i \leftrightarrow R_j \Rightarrow |\boldsymbol A| = -|\boldsymbol A|$
$[ER_2]: R_i \leftrightarrow kR_i \Rightarrow |\boldsymbol A| = k|\boldsymbol A|$

2.5 Orthogonal Matrices 正交矩阵

$\boldsymbol A \boldsymbol A^T = \boldsymbol A^T \boldsymbol A = I \\ \boldsymbol A^ {-1} = \boldsymbol A^T$

2.6 Eigenvalues and Eigenvectors 特征值和特征向量

$\boldsymbol A \vec \boldsymbol v = \lambda \vec \boldsymbol v \\ (\boldsymbol A - \lambda \boldsymbol I) \vec \boldsymbol v = 0 \\ det(\boldsymbol A - \lambda \boldsymbol I) = 0 \\$

2.6.1 Criteria for invertibility 可逆

行列式不为0
所有特征值都非零
strictly diagonally dominant 严格对角占优（充分不必要）

3 Differential Equations 微分方程

3.1 Introduction 简介

两种类型

Ordinary Differential Equation (O.D.E) 常微分方程
$\cdots, y^{(n)}) = 0$
$y^4 \neq y^{(4)}$
Partial Differential Equation (PDE) 偏微分方程
$\frac{\partial u}{\partial t} + \frac{\partial ^2 u}{\partial x \partial y} + \frac{\partial u}{\partial z} + u = 0$

术语：

order : n, 微分方程的最大阶数
degree : r, 微分方程order的的次数(pow)

$y'' + x(y')^3 - xy$ 是二阶（order=2）一次（degree=1）
$\sqrt{y' + y + x}$ 是二阶二次方程

线性ODE:

n阶线性方程
$\sum_{i=0}^{n} a_i(x)y^{(i)}(x) = g(x)$
所有微分都是1次，系数是x的函数（a(x)和g(x)不要求是1次，可以是常数，但不是y的函数）

对函数 $c_1, c_2, \cdots, c_n)$ 逐次，得到n个方程，
联合n+1个方程消去 $c_1, c_2, \cdots, c_n$ , 得到 $\cdots, y^{(n)}) = 0$

反过来理解： $c_1, c_2, \cdots, c_n)$ 是 $\cdots, y^{(n)}) = 0$ 的通解

3.1.1 Initial & Boundary Value Problems 初始值问题和边界值问题

从通解得到特解

Initial Value Problem (IVP)
$y^{(i)}(x_0)= \alpha_i, \ where \ i = 0,1, \cdots, n-1$ ，一共n个初始值条件
$e^x; \ y(\pi)=1, \ y'(\pi)=2$
Boudary Value Problem (BVP)
$y(x_i)= \beta_i, \ where \ i = 0,1, \cdots, n-1$ ，一共n个边界值条件
$y'' + 2y' = e^x; \ y(0)=1, \ y(1)=1$

3.2 First Order Ordinary Differential Equations 一阶常微分方程

一阶ODE的一般形式 $F (x, y, y^{'}) = 0$

3.2.1 One Variable Missing 缺少一个变量

x, y, y’中，没有x或者y的方程，可以用积分求解

没有y
$\rightarrow y = \int f(x)dx$
没有y’
$\rightarrow x = \int \frac{1}{f(y)}dx$

3.2.2 Variable Separable 变量分离

通过积分得到通解

$\rightarrow \int \frac{1}{h(y)}dy = \int g(x)dx + c$

3.2.3 Linear Equations 线性方程

用乘法法则进行组合，通过积分求解

求解
$\begin{aligned} & y' + P(x)y = Q(x) \\ & \rightarrow R(x)y' + R(x)P(x)y = \frac{d}{dx}(R(x)y) = R(x)Q(x) \\ & \rightarrow R(x)y = \int R(x)Q(x)dx + c \\ & \rightarrow y = \frac{1}{R(x)}(\int R(x)Q(x)dx + c) \\ \end{aligned}$
R(x)称为积分因子 Integrate Factor
$\\ R(x) = e^{\int P(x)dx}$

3.3 Second Order ODE.s 二阶ODE

$y^{''} = f (x, y, y^{'})$

3.3.1 Simplest Cases 简单情况

只有y’’, 没有y和y’：两次积分可以得到y
$\rightarrow y= \int \int f(x)dx$
没有y：用P表示y’，用P’表示y’’，求解一阶ODE得到y’’
$y^{''} = f (y^{'}, x)$
令 $\rightarrow y''=P'=f(P,x)$
得到一阶ODE得到P，积分得到y
没有y’和x：用p表示y’, 链式求导得到y’’(y)，求解一阶ODE得到p(y)
$y^{''} = f (y)$
令 $\rightarrow y'' = P' = \frac{dp}{dy} \frac{dy}{dx} = p \frac{dp}{dy} = f(y)$
得到一阶ODE的分离形式，两边积分得到f(y’, y)=0形式的一阶ODE，再次求解
没有x：用p表示y’, 链式求导得到y’’(y)，求解一阶ODE
$y^{''} = f (y^{'}, y)$
令 $\rightarrow y'' = P' = \frac{dp}{dy} \frac{dy}{dx} = p \frac{dp}{dy} = f(P,y)$
得到一阶ODE的第三种形式

3.3.2 Linear ODE.s of Order at least 2 二次及二次以上ODE

n阶线性方程的一般形式
$\sum_{i=0}^{n} a_i(x)y^{(i)}(x) = g(x)$

n阶线性微分算子
$\equiv \frac{d}{dx} \\ L = \sum_{i=0}^{n} a_i D^i \\ L \ y = g(x) \\$

L是线性操作符

Homogeneous
如果g(x) = 0，则 $\ y = 0$ 称为Homogeneous

$\ y = g(x)$ 的通解分为两部分 $y = y_c + y_p$
$y_c$ 称为 complimentary Function，是 $\ y = 0$ 的解
$y_p$ 称为Paritcular Integral，是 $\ y = g(x)$ 的解

3.3.3 Linear ODE.s with Constant Coeffcients 常系数线性ODE

考虑Homogeneous情况: $\ y = 0$
一阶 $\ y = ay' + by=0$
二阶 $\ y = ay'' + by' + cy = 0$

一阶方程的解为 $e^{\lambda x}$
可以把一阶看作二阶的一个特例：也就是一阶方程的解应该也适用于二阶
将一阶方程的解代入二阶方程：
$L(e^{\lambda x}) = (a \lambda ^2 + b \lambda + c)e^{\lambda x} = 0$
$\Longrightarrow a \lambda ^2 + b \lambda + c = 0$ 称为AUXILLIARY EQUATION (A.E)

$b^2-4ac > 0$ :
$y=c_1 e^{\lambda_1 x} + c_2 e^{\lambda_2 x}$
$b^2-4ac = 0$ :
除了 $e^{\lambda x}$ 之外， $e^{\lambda x}$ 也是一个解
$y=c_1 e^{\lambda x} + c_2 x e^{\lambda x}$
$b^2-4ac < 0$ :
$y = e^{px}(Acos \ qx + Bsin \ qx)$
p是实部，q是虚部
- 看推导过程，要求A是实数，B是纯虚数，
- 但是用通解代入时发现AB可以是任意数，不要求B为纯虚数
- 由于推导过程使用的常数项 $C_1, \ C_2$ 并不要求是实数，因此B可以不是纯虚数
- 同样A也可以是虚数

3.4 General nth Order Equation n阶方程

$L\ y = \sum a_n y^{(n)} \equiv 0 \\ L = \sum a_n D^{n} \\ A.E. \Longrightarrow \sum a_n \lambda ^ n = 0$

A.E.解的种类

n个不同实数解
$\sum _{i=1}^{n} \beta _i e ^{\lambda_i x}$
有n重实数根 $\lambda$
$e^{\lambda x} \sum_{i}^{n} \alpha_i x^{i - 1}$
有n重共轭复数根 $\pm iq$
$e^{px}[(\sum_{i=1}^{n} A_i x^{i-1})cos \ qx + (\sum_{i=1}^{n} B_i x^{i-1})sin \ qx]$
以上三种情况的混合

3.5 Non-Homogeneous Case - Method of Undetermined Coefficients 非齐次

$\ y = g(x), \ g(x) \neq 0$

$L \ y = L \ (y_c + y_p) \\ = L \ y_c + L \ y_p$

通解： $y = C . F . + P . I$

齐次项 $L \ y_c$ 的通解 $C . F$ 可以通过 A.E方程求解
非齐次项 $L \ y_p$ 的特解 $P . I$ 可以通过以下方法求解

“Guesswork” - which we are interested in
Annihilator
D-operator Method

Guesswork Method，猜测

g(x)的形式：

多项式
$\sum_{i=0}^{m} p_i x^{i}$
假设P.I的形式为 $\sum_{i=0}^{m} p_i x^{i}$ , 与g(x)的次数相同，代入方程求解系数，可得到 $y_p$
指数函数
$g(x) = Ce^{kx}$ , 其中k不是A.E的解
假设P.I的形式为 $Ae^{kx}$ , 代入方程求解A，可得到 $y_p$
三角函数
$Asin\ ax + Bcos\ ax$ , 其中ia不是A.E的解
假设特解的形式为 $Re(K e ^ {ia})$ , 代入方程求解K，可得到 $y_p$ （取实部）
或者直接假设特解的形式为 $Acos\ ax + Bsin\ ax$ ，求解A和B
以上三种的组合

3.5.1 Failure Case 不可直接求解的形式

$g(x) = Ce^{kx}$ , 其中k是A.E的根，

假设解为 $Ae^{kx}$ ，代入方程后，左边为0，无法求解
假设解为 $Ax^re^{kx}$ , r表示k是A.E的r重根（低次项已经包含齐次项通解中，不需要再求系数，也无法求解）

3.6 Linear ODE.s with Variable Coefficients - Euler Equation 可变系数的线性ODE - （柯西-）欧拉方程

Cauchy-Euler equation 柯西-欧拉方程：系数中x的次数，与微分的阶数相同
$\ y = \sum_{i = 0}^{n} a_i x^i y^{(i)} = g(x)$

考虑二阶的情况，先求解齐次项，假设 $x^{\lambda}$ ，代入方程得到
$\lambda^2 + (b-a) \lambda + c = 0$ ，三种情况：

两个实数解: $Ax^{\lambda_1} + Bx^{\lambda_2}$
二重根: $x^{\lambda}(A + Bln \ x)$
共轭虚数根 $x^{\alpha}(Acos(\beta ln\ x) + Bsin(\beta ln\ x))$
$x^{\pm i \beta } = e ^ { ln(x^{\pm i \beta}) } = e^{\pm i \beta ln \ x} = e^{\pm i \theta} \\ \theta = \beta ln \ x$

3.6.1 Reduction to constant coefficient 退化为常系数方程

$e^t, \ t = ln \ x \\ y' = \frac{dy}{dt} \times \frac{dt}{dx} = \frac{1}{x} \times \frac{dt}{dx} \\ y'' = \frac{1}{x^2}(\frac{d^2 y}{dt^2} - \frac{dy}{dt})$
代入柯西-欧拉方程，刚好可以消去可变项，得到常系数方程

按常系数方程求解通解和特解，再用 $\ x$ 替换

3.7 Partial Differential Equations 偏微分方程（略）

1 Probability 概率

1.1 Preliminaries 知识准备

experiment 实验：可重复，可产生一组输出的过程
event 事件：一个或多个输出的集合
sample space 样本空间：所有输出的集合，记作 $\Omega$

例子：掷六面色子
样本空间 $\Omega = \{1, 2, 3, 4, 5, 6\}$
事件

掷出偶数： $E_1 = \{2, 4, 6\}$
掷出奇数： $E_1 = \{1, 3, 5\}$
掷出素数： $E_1 = \{2, 3, 5\}$

1.1.1 Probability Scale 概率度量

事件E发生的概率P(E)满足条件 $\le P(E) \le 1$

1.1.2 Probability of an Event 事件概率

事件E发生的概率定义为

$\frac{事件E发生的次数}{所有输出发生的总次数}$

1.1.3 The Complimentary Event E’ 事件E的补集

E’表示E不发生，概率为 $P (E^{'}) = 1 - P (E)$

1.2 Probability Diagrams 用图表表示概率

三种表示方法

样本空间或二维表格
用两个色子掷出8的概率 $P(8)=\frac{5}{36}$
树型图
4红，5黄，11蓝，每次取出后放回，取两次，取出1个红球，1个蓝球的概率
$\frac{4}{20} \times \frac{11}{20} + \frac{11}{20} \times \frac{4}{20} = \frac{11}{50}$
Venn Diagram 文氏图：计算并集、交集、条件概率

1.3 Conditional Probability 条件概率

给定事件A发生的情况下，事件B发生的概率。记作 $P (B ∣ A)$

$P(A|B)=\frac{P(A \cap B)}{P(B)} \\ P(A \cap B) = P(A|B) \times P(B)$

Bayes’ Theorem

$\cap B) = P(B \cap A) \\ P(A|B) \times P(B) = P(B|A) \times P(A) \\ P(B|A) = \frac{P(A|B) \times P(B)}{P(A)}$

例子：10个硬币，9个普通硬币（一正一反），1个特殊硬币（两个正面），从中取出一个硬币，放5次，问题

取到5个正面的概率
取到普通硬币的概率 $\frac{9}{10}$
取到普通硬币后，得到正面的概率 $\frac{1}{2}$
取到特殊硬币的概率 $\frac{1}{10}$
取到特殊硬币后，得到正面的概率 $P (H ∣ S) = 1$
$\ Heads) = \frac{9}{10} \times (\frac{1}{2})^5 + \frac{1}{10} \times 1^5 = \frac{41}{320}$
取到5个正面时，这个硬币是特殊硬币的概率

$\ Heads) = \frac{P(5 \ Heads | S) \times P(S)}{P(5 \ Heads)} = \frac{1 \times \frac{1}{10}}{\frac{41}{320}} = \frac{32}{41}$

1.4 Mutually exclusive and Independent events 互斥和独立

互斥：
$\cap B) = 0$
$\cup B) = P(A) + P(B)$

独立：
$\cap B) = P(A) \times P(B)$
$P (A ∣ B) = P (A)$

1.5 Two famous problems

Birthday Problem：60个人中至少两个人是同一个生日的概率

所有人生日都不相同的概率 $\frac{365 \times 364 \times \cdots \times 306}{365 ^ {60}}$
有至少两个人生日相同的概率为 $1 - P = 0.5$

Monty Hall Game Show：ABC三个门，其中一个里面有车，另外两个有山羊，甲随机选了一个门，主持人去掉一个有山羊的门，这时候甲应该改变选择吗？

问题的关键在于主持人知道哪个门后面有车

1.6 Random Variables 随机变量

1.6.1 Notation 术语

随机变量： $\ Y, \ Z$
观察变量： $\ y, \ z$

1.6.2 Definition 定义

值空间不一定都是数值，进行从值空间到数轴的映射

1.6.3 Types of Random variable 随机变量的种类

离散：值可数
连续：值不可数

1.7 Probability Distributions 概率分布

1.7.1 Discrete distributions 离散分布

同时掷两个色子，和的概率分布
离散概率分布

1.7.2 Continuous Distributions 连续分布

单个值的概率分布为0 $P (X = x) = 0$

用PDF描述概率：Probablity Density Function
$\lt X \lt b) = \int _a^b f(x) dx$

PDF的特性：

$\ge 0$
$\int _{-\infty}^{\infty} f(x) dx = 1$
$\lt X \lt b) = \int _a^b f(x) dx$

1.8 Cumulative Distribution Function CDF 累积分布函数

概率累积： $\le x)$

1.8.1 Discrete Random variables

对小于x的值的概率进行累加

1.8.2 Continuous Random variables 连续随机变量

$\le x) = \int_{-\infty}^{x} f(t)dt$

1.9 Expectation and Variance 期望和方差

期望： $\mu$ ，描述分布均值
方差： $\sigma^2$ ，描述分布离散程度

1.9.1 Discrete Random variables 离散随机变量

$\sum_{all \ x} xP(X=x)$
$V(X) = E(X - E(X)) = E(X^2) - (E(X))^2$

1.9.2 Continuous Random Variables 连续随机变量

$\int_{all \ x} xf(x)dx$
$E(X))^2] = E(X^2) - (E(X))^2 = \int_{all \ x} x^2 f(x)dx - (\int_{all \ x} xf(x)dx)^2$

1.10 Expectation Algebra 期望值的代数运算

期望是线性操作
$\\ E(aX) = aE(X) \\ E(X + Y) = E(X) + E(Y) \\$
$V(X + a) = V(X) \\ V(aX) = a^2V(X) \\ V(b) = 0 \\$

如果X和Y独立
$\\ V(X + Y) = V(X) + V(Y) \\$

如果不独立
$\\ Cov(X, Y) = E[(X-E(X))(Y-E(Y)]$

1.11 Moments 矩

一阶矩： $\mu$
n阶矩： $E(X^n) = \int_{all \ x} x^n f(x) dx$

中心距：

二阶中心矩：方差 $\sigma^2$
三阶中心距： $E[(X-E(X))^3]$
偏度（三阶归一化中心距）：度量非对称性
$\frac {E[(X-E(X)) \ ^3]}{\sigma ^ 3}$
尾度（四阶归一化中心距）：度量肥尾特性
$\frac {E[(X-E(X)) \ ^4]}{\sigma ^ 4}$
- kurtosis越大，表示尾部数据的概率分布越高（fat tail 肥尾）
- 正态分布的kurtosis为3
- Leptokurtic: kurtosis大于3，PDF图像呈现尖峰肥尾
- Platykurtic: kurtosis小于3，PDF图像比较平坦

1.12 Covariance 协方差

如果X和Y独立 $E (X Y) = E (X) E (Y)$ $

协方差： $C o v (X, Y) = E [(X - E (X)) (Y - E (Y)] = E (X Y) - E (X) E (Y)$

相关性：
$\rho _{XY} = \frac{Cov(X, Y)}{\sigma_X \sigma_Y}$

$\rho _{XY}$ 等于-1，负相关，反向变化，等于1，正相关，同向变化，等于0，不相关

1.13 Important Distributions 重要分布

这些概率分布适用于对不同的对象进行建模

1.13.1 Binomial Distribution 二项式分布

多次伯努利实验的累积

实验次数为n
实验之间相互独立
成功概率（=1的概率）为p

$\begin{aligned} X & \sim B(n, p) \\ P(X=x) & = C_x^n p^x(1-p)^{n-x} \\ C_x^n& = \frac{n!}{x!(n-x)!} \\ E(X) & = np \\ V(X) & = np(1-p) \end{aligned}$

1.13.2 Poisson Distribution 泊松分布

泊松分布：对违约个数进行建模

两个事件同时发生时，没有影响
事件之间相互独立
事件在所有时间点发生的概率相同

$\begin{aligned} X & \sim Po(\lambda) \\ P(X=r) & = \frac{e^{-\lambda}\lambda^r} {r!}, \ where \ r = 0, 1, 2, \cdots \\ E(X) & = \lambda \\ V(X) & = \lambda \end{aligned}$

1.13.3 Normal Distribution 正态分布

正态分布时最常用连续分布

$\begin{aligned} X & \sim N(\mu, \sigma^2) \\ E(X) & = \mu \\ V(X) & = \sigma^2 \\ PDF=f(x) & = \frac{1}{\sigma\sqrt{2\pi}} e^{- \frac{(x-\mu)^2}{2\sigma^2} } \\ CDF=P(X \leq x) & = \int_{-\infty}^{x}\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(s-\mu)^2}{2\sigma^2}}ds \\ \int_{-\infty}^{\infty}\frac{1}{\sigma\sqrt{2\pi}}e^{\frac{(x-\mu)^2}{2\sigma^2}}dx & = 1 \\ \end{aligned}$

1.13.4 Standard Normal distribution 标准正态分布（z分布）

$\begin{aligned} Z & \sim N(0, 1) \\ E(X) & = 0 \\ V(X) & = 1 \\ PDF=f(z) & = \frac{1}{\sqrt{2\pi}}e^{- \frac{z^2}{2}} \\ CDF=\Phi(z) & = \int_{-\infty}^{z}\frac{1}{\sqrt{2\pi}}e^{- \frac{s^2}{2}}ds \\ Z & = \frac{X - \mu}{\sigma} \end{aligned}$

1.13.5 Common regions 常用区间

正态分布的区间概率

区间	概率
$\pm\sigma$	68%
$±2σ \pm2\sigma$	95%
$±3σ \pm3\sigma$	99.8%

1.14 Central Limit Theorem 中心极限定理

$X_1, X_2, \cdots, X_n$ 是独立同分布(independent same distribution, iid)的随机变量

样本均值 $\bar X = \frac{\sum_{i=1}^{n}X_i}{n}$ 符合正态分布

X的分布可以是任意分布
只需要很小的n就可以产生正态分布
Total and means are quantities of interest

$\begin{aligned} E(\bar X) & = \mu \\ V(\bar X) & = \sigma^2/n \\ \bar X & \sim N(\mu, \sigma^2) \\ \frac{\bar X - \mu}{\sigma \sqrt{n}} & \sim N(0, 1) \end{aligned}$

2 Statistics 统计

2.1 Sampling 采样

采样的权重（概率）都是 $\frac{1}{N}$

总体
$\begin{aligned} \mu & = \frac{1}{N}\sum_{i=1}^{N}x_i \\ \sigma^2 & = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2 \end{aligned}$

样本
$\begin{aligned} \bar X & = \frac{1}{n}\sum_{i=1}^{n}x_i \\ E(\bar X) & = \mu \\ S^2 & = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar x)^2 \\ E(s^2) & = \sigma^2 \end{aligned}$

2.1.1 Proof 证明

独立同分布假设可以得到 $V(\sum_{i=1}^nx_i) = n\sigma^2$

根据中心极限定理，得到：
$\begin{aligned} E(\bar X) & = \mu \\ V(\bar X) & = \frac{\sigma ^ 2}{n} \\ V(\bar X) & = E(\bar X^2) - [E(\bar X)]^2 \Longrightarrow E(\bar X^2) & = \frac{\sigma^2}{n} + \mu^2 \\ 令n=1 \Longrightarrow E(X_i^2) & = {\sigma^2} + \mu^2 \\ E(S^2) & = \frac{1}{n-1}E[\sum(X_i - \bar X)^2] \\ & = \frac{1}{n-1}E[\sum X_i^2 - n \bar X^2] \\ & = \frac{1}{n-1}\sum E(X_i^2) - n[E(\bar X)]^2 \\ & = \frac{1}{n-1}(n({\sigma^2} + \mu^2) - n ( \frac{\sigma^2}{n} + \mu^2)) = \sigma ^2 \\ \end{aligned}$

2.2 Maximum Likelihood Estimation 极大似然估计 MLE

统计方法
用数据拟合模型

用观测值估计模型的参数：按照给定的数据，什么样的模型参数可能会给出这样的数据

2.2.1 Motivating example

先假设数据服从某个分布（带参数的分布），例如二项式分布
观测一组数据（独立同分布）
将数据代入似然函数（分布函数），求解使得似然函数取最大值的参数

求梯度得到极值对应的参数值

2.2.2 In General

$\begin{aligned} l(\theta; x_1, x_2, x_3, \cdots, x_n) & = f(x_1, x_2, x_3, \cdots, x_n; \theta) \\ L(\theta; x_1, x_2, x_3, \cdots, x_n) & = log \ l(\theta; x_1, x_2, x_3, \cdots, x_n) \end{aligned}$
目标：找到使得L最大的参数 $\theta$

2.2.3 Normal Distribution

估算 $\mu和\sigma$

假设

$\sim N(\mu, \sigma^2)$ , i.e. $f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
$x_1, x_2, x_3, \cdots, x_n$ 是iid的随机采样

$\begin{aligned} & L(\mu, \sigma; x_1, x_2, x_3, \cdots, x_n) \\ = & log \ l(\mu, \sigma; x_1, x_2, x_3, \cdots, x_n) \\ = & log \ f(x_1, x_2, x_3, \cdots, x_n; \mu, \sigma) \\ = & log \prod_{i=1}^n f(x_i; \mu, \sigma) \\ = & \sum_{i=1}^n logf(x_i; \mu, \sigma) \\ = & \sum_{i=1}^n log(\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x_i-\mu)^2}{2\sigma^2}}) \\ = & \sum_{i=1}^n (log(\frac{1}{\sigma\sqrt{2\pi}})-\frac{(x_i-\mu)^2}{2\sigma^2}) \\ = & -\frac{n}{2}log(2\pi)-nlog(\sigma)-\frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \mu)^2 \end{aligned}$