教你如何成为数据科学家(二)

由于数据科学家需要和大量的数字打交道,所以统计学方面的知识要求很多


  1. Pick a Dataset (UCI Repo)                                                      选取一个数据集(给了一个加州大学欧文分校的数据集链接)
  2. Descriptive Statistics(meanmedianrangeSDVar)            描述统计学(平均值,中位数,范围,标准差,方差)
  3. Exploratory Data Analysis                                                       探索性数据分析
  4. Histograms                                                                              直方图
  5. Percentiles & Outliers                                                             百分位值和异常值
  6. Probability Theory                                                                   概率论
  7. Bayes Theorem                                                                      贝叶斯定理
  8. Random Variables                                                                  随机变量
  9. Cumulative Distribution Function (CDF)                                累加分布函数
  10. Continuous Distributions (NormalPoissonGaussian)          连续分布(正常,泊松,高斯)
  11. Skewness                                                                               偏斜度
  12. Analysis of Variance (ANOVA)                                               方差分析
  13. Probability Density Function (PDF)                                        概率密度函数
  14. Central Limit Theorem                                                           中心极限定理
  15. Monte Carlo Method                                                              蒙特卡洛方法
  16. Hypothesis Testing                                                                假设检验
  17. p-Value                                                                                 p值(统计学内的概念)
  18. Chi-square Test                                                                   卡方检验
  19. Estimation                                                                             估计
  20. Confidence Interval (CI)                                                       置信区间
  21. Maximum Likelihood Estimation (MLE)                                 最大似然估计
  22. Kernel Density Estimate                                                       核密度估计(统计学内的概念)
  23. Regression                                                                           回归
  24. Covariance                                                                          协方差              
  25. Correlation                                                                          相关性
  26. Pearson Coeff                                                                     皮尔森系数
  27. Causation                                                                           因果关系
  28. Least Squares Fit                                                               最小二乘法拟合
  29. Euclidean Distance                                                             欧氏距离
可以看到不少概念都是我们概率和统计学里面学过的,但是英文表达方式就不是太认识了……



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值