Data analysis
iteye_3843
这个作者很懒,什么都没留下…
展开
-
用excel进行数据分析——简单图表分析
例子:为评价家电行业售后服务的质量,随机抽取由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.较差;E.差。调查结果如下:B E C C A D C B A ED A C B C D E C E EA D B C C A E D C BB A C D E A B D D CC B C E D B C C B CD A C B C D...原创 2014-08-23 14:24:39 · 1877 阅读 · 0 评论 -
R与γ(伽玛)分布(3) 分布的检验方法
在[url=http://jobar.iteye.com/blog/2153779]R与指数分布(3)分布的检验[/url]中我们提到了指数分布的Kolmogorov-Smirnov连续分布检验法。现在我们同样用它来一个连续分布是否是服从检验γ分布。原假设为H0:数据集符合伽玛分布研究假设H1:样本所来自的总体分布不符合伽玛分布。令F0(x)表示预先假设的理论分布,Fn(x)表示随...原创 2014-11-15 21:38:17 · 6390 阅读 · 0 评论 -
R与t分布(2) 累积分布函数
t分布的累积分布函数为:[img]http://upload.wikimedia.org/math/1/7/a/17a31fc1ec3911c61d27007cb99c1910.png[/img]其中其中:[img]http://upload.wikimedia.org/math/4/6/1/46101ad044b9e9f6c19644e61e7deb7a.png[/img]是超几何函数...原创 2014-11-17 20:53:00 · 3017 阅读 · 0 评论 -
R与t分布(3) 分布的检验
我们依然用Kolmogorov-Smirnov连续分布检验法来检验一个连续分布是否是服从t分布。 原假设为H0:数据集符合t分布 研究假设H1:样本所来自的总体分布不符合t分布。 令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数. 统计量D为: D=max|F0(x) - Fn(x)| D值越小,越接近0,表示样本数据越接近t分布 ...原创 2014-11-19 20:47:39 · 2167 阅读 · 0 评论 -
R与F分布(1) 概率密度函数
F分布: F分布是以统计学家R.A.Fisher姓氏的第一个字母命名的. F分布的用途:用于方差分析、协方差分析和回归分析等。 (一)F分布定义设X、Y为两个独立的随机变量,X服从自由度为m的卡方分布,Y服从自由度为n的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=(x/m)/(y/n)服从自由度为(m,n)的F-分布, 上式F服从第一自由度为m,第二...原创 2014-11-20 21:44:02 · 4146 阅读 · 0 评论 -
R与F分布(2) 累积分布函数
累积分布函数为:[img]http://upload.wikimedia.org/math/4/e/d/4ed4062d18cd21c3910145c1172b9038.png[/img]I是不完全Beta函数。[code="java"]set.seed(1000)x原创 2014-11-21 21:42:28 · 1642 阅读 · 0 评论 -
R与F分布(3) 分布检验
我们依然用Kolmogorov-Smirnov连续分布检验法来检验一个连续分布是否是服从F分布。 原假设为H0:数据集符合F分布 研究假设H1:样本所来自的总体分布不符合F分布。 令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数. 统计量D为: D=max|F0(x) - Fn(x)| D值越小,越接近0,表示样本数据越接近F分布 ...原创 2014-11-23 21:41:47 · 2313 阅读 · 0 评论 -
R与χ²分布(1) 概率密度函数
卡方分布(chi-square distribution, χ²-distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布。假设检验和置信区间的计算。由卡方分布延伸出来皮尔森卡方检定常用于: (1)样本某性质的比例分布与总体理论分布的拟合优度;(2)同一总体的两个随机变量是否独立;(...原创 2014-11-24 21:04:20 · 3392 阅读 · 0 评论 -
R与χ²分布(2) 累积分布函数
卡方分布的累积分布函数为:[img]http://upload.wikimedia.org/math/f/2/4/f24014aad4cd81a63d4e1109146a6035.png[/img]其中γ(k,z)为不完全Gamma函数在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.org Calc和Microsoft Excel...原创 2014-11-25 21:57:36 · 1909 阅读 · 0 评论 -
R与γ(伽玛)分布(2) 累积分布函数
其累积分布函数为:[img]http://upload.wikimedia.org/math/c/d/a/cda64db5cca2f009140347d225203ec1.png[/img][code="java"]set.seed(1000)x原创 2014-11-14 21:09:10 · 5017 阅读 · 0 评论 -
R与γ(伽玛)分布(1) 概率密度函数
伽玛分布是统计学的一种连续概率函数,是著名的皮尔逊概率分布函数簇中的重要一员,称为皮尔逊Ⅲ型分布。它的曲线有一个峰,但左右不对称。伽玛分布中的参数α,称为形状参数,β称为尺度参数。概率函数令[img]http://upload.wikimedia.org/math/f/a/a/faa694c34d0919753cb02651b096a447.png[/img] 且令[img]http://...原创 2014-11-13 17:48:16 · 8395 阅读 · 1 评论 -
Excel解回归分析的回归系数
假设店面的营业额与店面面积和距车站的距离有线性关系:统计得到下面的数据:总店 面积 距车站距离 营业额1 10 80 4692 8 0 3663 8 200 3714 5 200 2085 7 300 2466 8 230 2977 7 40 3638 9 0 4369 6 330 19...原创 2014-09-04 15:53:08 · 2016 阅读 · 0 评论 -
在Windonw下R中安装RMySQL
在Windonw下R中安装RMySQL参考文章http://www.ahschulz.de/2013/07/23/installing-rmysql-under-windows/和http://cran.r-project.org/web/packages/RMySQL/INSTALL我的安装步骤:1 安装RTools2 安装mysql-5.6.20-winx64(Ty...原创 2014-09-12 15:14:02 · 191 阅读 · 0 评论 -
R中如何求众数
R中没有直接求众数的函数q1 table(q1)q13 4 5 6 7 8 1 1 3 2 2 1 > max(table(q1))[1] 3> table(q1) == max(table(q1))q1 3 4 5 6 7 8 FALSE FALSE TRUE FALSE FALSE FALSE ...原创 2014-10-10 13:04:05 · 7609 阅读 · 0 评论 -
R与正态分布(1) 概率密度函数
摘自百度百科:正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经...原创 2014-10-20 18:12:38 · 8990 阅读 · 0 评论 -
R与正态分布(2) 累积分布函数
累积分布函数为:[img]http://dl2.iteye.com/upload/attachment/0102/2695/e36481d6-9d5e-36e6-ae4d-7f10f7552c3e.jpg[/img][code="java"]set.seed(0)x原创 2014-10-21 17:39:32 · 5386 阅读 · 0 评论 -
R与正态分布(3)分布的检验
Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体,先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平α,以及根据样本量为n时所对应的系数αi,根据特定公式计算出检验统计量W。最后查特定的正态性W检验临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分布,否则拒绝假设...原创 2014-10-29 08:29:03 · 780 阅读 · 0 评论 -
R与指数分布(1) 概率密度函数
在概率论和统计学中,指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。概率密度函数一个指数分布的概率密度函数是:[img]http://upload.wikimedia.org/math/7/c/1/7c1e7458e99f77f22c350...原创 2014-10-31 21:51:10 · 10502 阅读 · 0 评论 -
R与指数分布(2) 累积分布函数
累积分布函数,又叫累计分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(Cumulative Distribution Function)表记。对于所有实数x ,累积分布函数定义如下:[img]http://upload.wikimedia.org/math/5/a/b/5ab3ef37703a0f5eda7e17711e8b18fc.pn...原创 2014-11-06 22:08:01 · 4022 阅读 · 0 评论 -
R与χ²分布(3) 分布检验
我们依然用Kolmogorov-Smirnov连续分布检验法来检验一个连续分布是否是服从χ²分布。 原假设为H0:数据集符合χ²分布 研究假设H1:样本所来自的总体分布不符合χ²分布。 令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数. 统计量D为: D=max|F0(x) - Fn(x)| D值越小,越接近0,表示样本数据越接近χ²...原创 2014-11-27 20:54:44 · 924 阅读 · 0 评论