学完Udacity的统计基础已经半个月了,这半个月已经把编程基础(python)课程过关了,在准备对线性代数火力全开之前,把统计的内容做个回顾,给自己以后复习或者给一些新同学带来帮助。
先梳理下知识结构吧
研究方法入门
#这节课在我看来主要以新名词和概念比较多,当然很多的英语词汇也造成了困扰。挑选了一些写出来
1、 correlation does not prove causation 相关性不意味着因果关系
印象最深刻的一句话,主要解释了在统计中,样本中的数据结果有着潜在因素的影响,而轻易得出所谓的结论。我们要尽量避免潜在因素影响和选择正确的统计方法。
2、Golden Arches Theory 金色拱门理论
Thomas Friedman:No two counties with a MicDonald’s have ever gone to war since opening the McDonald’s.
适逢其会,正是麦克劳在中国更名为金拱门的时间。我觉得这是有关系的。
3、控制因素
placebo 安慰剂(The inactive pill) 即实验中的无效药物
placebo effect 安慰剂作用。 如:药物试验中,给两组患者一组测试药物,一组无效药物
安慰剂用于控制心理因素对实验造成的影响
单盲:只有参与者(患者)不知道哪种药是无效的。blinding
双盲:参与者和测试人员都不知道哪种药是无效。 double blinding
4、研究方式
观察研究:是非随机化的研究,在自然状态下对研究对象的特征进行观察,记录,并对结果惊醒描述和对比 分析的研究
试验研究:就是人为的干预措施,而收集到结果的分析性研究
5、数据统计图
bar chart 条形图 = bar graph 柱状图
histogram 直方图
normally distributed 正态分布
mode 众数
mean 平均数
media 中位数