统计学里的小故事

上课老师提到一句很重要的话—随机非随意
也不是这位老师创作的,貌似是一位德高望重的老先生说过的吧。对统计学的理解很有帮助,我的理解如下:
随机性大概是:即便是不能知道具体哪种情况会发生,但是总逃不出“手掌心”,也就是说事件发生的总体情况是可预见的。而这一点可以很明显地与“随意”区分开来。

读书笔记:
最近在看John.A.Rice的《数理统计与数据分析》,随手记下一点点笔记。
1.辛普森悖论
简述:一个反直觉的结论。
要求:尽可能抽出红球。
情况1:

黑色盒子白色盒子
5个红球3个红球
6个绿球4个绿球

那么,
在黑色盒子中,抽到红球的概率为5/11=0.455,
在白色盒子中,抽到红球的概率为3/7=0.429
结论:从黑色盒子中抽取。
情况2:

黑色盒子白色盒子
6个红球9个红球
3个绿球5个绿球

那么,
在黑色盒子中,抽到红球的概率为6/9=0.667,
在白色盒子中,抽到红球的概率为9/14=0.643
结论:从黑色盒子中抽取。
情况3:
将上述两种情况的黑色盒子和白色盒子分别混合在一起,即:

黑色盒子白色盒子
11个红球12个红球
9个绿球9个绿球

那么,
参考情况1和情况2,应该选择从黑色盒子中抽取。
而,实际上,此时,
在黑色盒子中,抽到红球的概率为11/20=0.55,
在白色盒子中,抽到红球的概率为12/21=0.571
即应该从白色盒子中抽取。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
技术成就梦想 @ DataGuru 专业数据分析社区 网址:edu.dataguru.cn 1 大数据的统计学基础 近年来, 存储设备的单位成本以惊人的速度下降,我们可以轻而易举地积累起大 量的数据。电信 运营商,可以记录用户通话、短消息、无线上网产生的每一条 信令, 省级运营商一小时写入存储设备的数据量可以达到几百 G。 电子商务网站, 可以记录用户的每一 次交易,甚至每一次点击,可以复原用户的完整访问路径 找出用户的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每 秒钟都在产生海量的视频数 据。在生命科学领域,对人体的 DNA 分析,一个个 体就能产生几个 G 数据, 可以想象如果一个生物信息数据库包含了成千万的个 体数据,信息量将会是怎样一个 规模,如此等等,不胜枚举。我们毫无疑问, 正处于一个信息爆炸的时代。 不幸的是, 我们得到的这些数据的绝大部分,在它的生命周期基本上都被闲 置着, 从来没有考虑过产生任何的价值, 唯一的用途就是"保存备查"。 尽管"啤 酒与尿布"的故事,已经写入教科书有 10 多年了,几乎每一个接受过专业教育 的同仁都知道数据挖掘能产生的价值,但是直到今天,我们对数据的处理依然很 低。造成这种情况的原因有很多。其之一是,在各公司保管数据的大多是 IT 人员,他们通常都缺乏必要的数学素质和知识基础去进行建模和深入的分析 工作,即使是业务人员也鲜有对数据有深入认识者。我们推出大数据系列(包括 Hadoop,NoSQL,Mahout 等)和数据分析系列(包括 R,SAS 等)课程后,观察 学员(特别是 IT 工作者和业务人员)的学习状况,发现他们的大多数严重缺 乏进一步挖掘数据价值所需的数学素养。 本门课程的目标, 正是要打破这种鸿沟, 为大家巩固基础,为进一步在数据领域前进提供更强动力。统计学,被誉为是数 据金字塔的"基础之基础",统计学知识扎实,无论学习 R,SAS,机器学习, 数据挖掘,大数据分析等领域知识都会得心应手,省去回头补课的麻烦。 课程内容: 第 1 课 面向小白的统计学:描述性统计(均值,位数,众数,方差,标准差, 与常见的统计图表) 第 2 课 赌博设计:概率的基本概念,古典概型 第 3 课 每人脑袋有个贝叶斯:条件概率与贝叶斯公式,独立性 第 4 课 啊!微积分:随机变量及其分布(二项分布,均匀分布,正态分布) 第 5 课 万事皆由分布掌握:多维随机变量及其分布 第 5 课 砖家的统计学:随机变量的期望,方差与协方差 第 6 课 上帝之手,统计学的哲学基础:大数定律、心极限定理与抽样分布 第 8 课 点数成金,从抽样推测规律之一:参数估计之点估计 第 9 课 点数成金,从抽样推测规律之二:参数估计之区间估计 第 10 课 对或错?告别拍脑袋决策:基于正态总体的假设检验 第 11 课 扔掉正态分布:秩和检验 第 12 课 预测未来的技术:回归分析 第 13 课 抓住表象背后那只手:方差分析 第 14 课 沿着时间轴前进,预测电子商务业绩:时间序列分析简介 技术成就梦想 @ DataGuru 专业数据分析社区 网址:edu.dataguru.cn 2 第 15 课 PageRank 的背后:随机过程与马尔科夫链简介 授课对象: 这是一门数学课程,适合有志于转往大数据分析领域的非数学专业人士(例如 IT 人,业务人员等)补强数学基础,以更好地学习更高级的数据分析,数据挖 掘,机器学习课程 授课讲师: 黄志洪(tigerfish),ITPUB 创始人,炼数成金创始人。山大学海量数据与 云计算 研究心主任。数据库专家,数据分析专家,有丰富的 IT 领域、数学领 域的知识经验。曾经讲授炼数成金上《数据分析、展现与 R 语言》、《数据分析 与 SAS》、《Hadoop 数据分析平台》等多门受欢迎课程。他将带领他的数据分 析团队完成整个授课工作。 何翠仪,山大学统计学专业毕业,炼数成金专职讲师,在过去曾负责多门炼数 成金数据分析课程的助教工作,目前正在主持建设炼数成金的认证题库系统。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值