由于数据科学家需要和大量的数字打交道,所以统计学方面的知识要求很多
- Pick a Dataset (UCI Repo) 选取一个数据集(给了一个加州大学欧文分校的数据集链接)
- Descriptive Statistics(mean, median, range, SD, Var) 描述统计学(平均值,中位数,范围,标准差,方差)
- Exploratory Data Analysis 探索性数据分析
- Histograms 直方图
- Percentiles & Outliers 百分位值和异常值
- Probability Theory 概率论
- Bayes Theorem 贝叶斯定理
- Random Variables 随机变量
- Cumulative Distribution Function (CDF) 累加分布函数
- Continuous Distributions (Normal, Poisson, Gaussian) 连续分布(正常,泊松,高斯)
- Skewness 偏斜度
- Analysis of Variance (ANOVA) 方差分析
- Probability Density Function (PDF) 概率密度函数
- Central Limit Theorem 中心极限定理
- Monte Carlo Method 蒙特卡洛方法
- Hypothesis Testing 假设检验
- p-Value p值(统计学内的概念)
- Chi-square Test 卡方检验
- Estimation 估计
- Confidence Interval (CI) 置信区间
- Maximum Likelihood Estimation (MLE) 最大似然估计
- Kernel Density Estimate 核密度估计(统计学内的概念)
- Regression 回归
- Covariance 协方差
- Correlation 相关性
- Pearson Coeff 皮尔森系数
- Causation 因果关系
- Least Squares Fit 最小二乘法拟合
- Euclidean Distance 欧氏距离
可以看到不少概念都是我们概率和统计学里面学过的,但是英文表达方式就不是太认识了……