如何建立这个自学系统?这里参考下知乎上两位清华大佬辅修统计学的课表,并列出每门课程的综合评估推荐的书籍和资源。
图片来源:zhihu.com/question/4282
以下课程学习周期两个月,可根据实际需要挑拣部分学习,学习难度按顺序依次增加(个人观点):
《初等概率论》:几乎是每个大学的数学基础必修课,难度不大,但是需要弄清楚很多概念,不然到后期学习进阶的时候非常痛苦,比如最基础的总体、样本、总体方差、样本方差、抽样方差、标准误和均方误差的区别。把初等概率论介绍得最完整且每个概念都加上案例的教材推荐用的是 Probability and Statistics 4E。
《数据科学导论》:因为R语言、stata等工具是比较适合用来做统计分析的,里面集成了大量现成的包和函数来直接实现采样、假设检验、分布函数等,这门课程主要讲解R语言的基础,比如数据处理(dplyr, reshape2, data.table,tidyverse)可视化(ggplot2)web(shiny)文本分析(Regular Expression)都是目前最火最有用的技能,这里就自己推荐一本最火的R语言实战 2E。
《线性回归分析》:线性回归几乎是所有模型的入门模型,但是很多课程上只讲了如何去拟合得到模型,没有讲解用线性模型的条件和模型成立的检验。这门课程主要讲了线性回归的本质整门课五个slides——基础知识/一元线性回归/矩阵形式/多元线性回归/方差分析。包括讲述了模型如何诊断问题,如何改进。教材是国外研究生最推