- 博客(4)
- 收藏
- 关注
原创 收集中你做错了什么?
研究报告常提出因为A的原因引起了B的现状。例如一些报告说,吸烟多少跟学校的成绩相关。报告还会给出一些看起来2者的相关的数据,但是是否就能表示成绩差是吸烟导致?或者成绩差而导致吸烟?还是其他原因?单从统计的关联性推断出因果关系正确吗?这对软件开发统计分析有什么启发?我常常强调,在利用统计来做分析数据时,好像是A引起B,但是其实不一定,首先要看看是否合理。所以在做统计分析时,要请项目经理从
2015-12-25 16:28:47 369
原创 基于大数据的软件缺陷分析和预测
那些对软件质量严格要求的行业,比如银行、财务、通信,因它们知道单是靠最终的系统测试无法把潜在的缺陷找出来,所以都愿意花费大量精力,找很有经验的程序员去做代码评审来找缺陷,。从2000年开始,学术界对缺陷的预测已经做了非常多的研究,一直收集产品发布的不同历史,包括缺陷历史、变更历史、代码本身。通过数据分析,可以找出在新版本里面容易出错的地方,经过多年研究,这种预测的成功率越来越高。如果公司可以系
2015-12-18 16:50:19 4873 1
原创 什么是平均值 (Average)?
在学习基本统计概念时,一组数据的均值包含多个意义,它既可以是数学平均值、中间值、众数。举例说明它们之间的不同:计算出一个小区每个家庭的平均收入是14000元/月。这个数字含有以下3个意义。数学上的均值 (arithmetical average)——把所有的数据加起来再除以它的个数。中位数 (Median)——所有的数据里面抽一个中间的数,所有数据中一半的数据比它大,一半比它小,如果个数为
2015-12-14 10:45:49 6794
原创 杂志中的调查数据可信吗?
很多人觉得统计是一件很枯燥的事情,最近看了一本书《How to lie with statistics统计数据背后的真相》,这本书被《大西洋杂志》评价为:让人们对一直认为不可动摇的统计数据有了新的思路。后面我们抽了几个故事与大家分享,在统计和度量方面都很有启发。 大家在报纸杂志上看到很多统计数据,这些数据是否可信呢?举一个简单例子,50年初,美国时代杂志报道耶鲁大学1924年
2015-12-10 16:53:07 620
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人