R
iteye_3843
这个作者很懒,什么都没留下…
展开
-
程序员学习R需要注意的一些事项
1 对象名称中的句点(.)没有特殊意义,但美元符号($)却有着和其他语言中的句点类似的含义,即指定一个对象中的某些部分。例如,A$x是指数据框A中的变量x。2 R不提供多行注释或块注释功能。必须以#作为多行注释每行的开始。出于调试目的,也可以把想让解释器忽略的代码放到语句if(FALSE){... }中。将FALSE改为TRUE即允许这块代码执行。3 将一个值赋给某个向量、矩阵、数组或列表...原创 2014-05-29 16:14:18 · 162 阅读 · 0 评论 -
R与γ(伽玛)分布(2) 累积分布函数
其累积分布函数为:[img]http://upload.wikimedia.org/math/c/d/a/cda64db5cca2f009140347d225203ec1.png[/img][code="java"]set.seed(1000)x原创 2014-11-14 21:09:10 · 4927 阅读 · 0 评论 -
R与γ(伽玛)分布(3) 分布的检验方法
在[url=http://jobar.iteye.com/blog/2153779]R与指数分布(3)分布的检验[/url]中我们提到了指数分布的Kolmogorov-Smirnov连续分布检验法。现在我们同样用它来一个连续分布是否是服从检验γ分布。原假设为H0:数据集符合伽玛分布研究假设H1:样本所来自的总体分布不符合伽玛分布。令F0(x)表示预先假设的理论分布,Fn(x)表示随...原创 2014-11-15 21:38:17 · 6190 阅读 · 0 评论 -
R与t分布(2) 累积分布函数
t分布的累积分布函数为:[img]http://upload.wikimedia.org/math/1/7/a/17a31fc1ec3911c61d27007cb99c1910.png[/img]其中其中:[img]http://upload.wikimedia.org/math/4/6/1/46101ad044b9e9f6c19644e61e7deb7a.png[/img]是超几何函数...原创 2014-11-17 20:53:00 · 2957 阅读 · 0 评论 -
R与t分布(3) 分布的检验
我们依然用Kolmogorov-Smirnov连续分布检验法来检验一个连续分布是否是服从t分布。 原假设为H0:数据集符合t分布 研究假设H1:样本所来自的总体分布不符合t分布。 令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数. 统计量D为: D=max|F0(x) - Fn(x)| D值越小,越接近0,表示样本数据越接近t分布 ...原创 2014-11-19 20:47:39 · 2123 阅读 · 0 评论 -
R与F分布(1) 概率密度函数
F分布: F分布是以统计学家R.A.Fisher姓氏的第一个字母命名的. F分布的用途:用于方差分析、协方差分析和回归分析等。 (一)F分布定义设X、Y为两个独立的随机变量,X服从自由度为m的卡方分布,Y服从自由度为n的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布即F=(x/m)/(y/n)服从自由度为(m,n)的F-分布, 上式F服从第一自由度为m,第二...原创 2014-11-20 21:44:02 · 4040 阅读 · 0 评论 -
R与F分布(2) 累积分布函数
累积分布函数为:[img]http://upload.wikimedia.org/math/4/e/d/4ed4062d18cd21c3910145c1172b9038.png[/img]I是不完全Beta函数。[code="java"]set.seed(1000)x原创 2014-11-21 21:42:28 · 1622 阅读 · 0 评论 -
R与F分布(3) 分布检验
我们依然用Kolmogorov-Smirnov连续分布检验法来检验一个连续分布是否是服从F分布。 原假设为H0:数据集符合F分布 研究假设H1:样本所来自的总体分布不符合F分布。 令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数. 统计量D为: D=max|F0(x) - Fn(x)| D值越小,越接近0,表示样本数据越接近F分布 ...原创 2014-11-23 21:41:47 · 2258 阅读 · 0 评论 -
R与χ²分布(1) 概率密度函数
卡方分布(chi-square distribution, χ²-distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布。假设检验和置信区间的计算。由卡方分布延伸出来皮尔森卡方检定常用于: (1)样本某性质的比例分布与总体理论分布的拟合优度;(2)同一总体的两个随机变量是否独立;(...原创 2014-11-24 21:04:20 · 3319 阅读 · 0 评论 -
R与χ²分布(2) 累积分布函数
卡方分布的累积分布函数为:[img]http://upload.wikimedia.org/math/f/2/4/f24014aad4cd81a63d4e1109146a6035.png[/img]其中γ(k,z)为不完全Gamma函数在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.org Calc和Microsoft Excel...原创 2014-11-25 21:57:36 · 1844 阅读 · 0 评论 -
R与γ(伽玛)分布(1) 概率密度函数
伽玛分布是统计学的一种连续概率函数,是著名的皮尔逊概率分布函数簇中的重要一员,称为皮尔逊Ⅲ型分布。它的曲线有一个峰,但左右不对称。伽玛分布中的参数α,称为形状参数,β称为尺度参数。概率函数令[img]http://upload.wikimedia.org/math/f/a/a/faa694c34d0919753cb02651b096a447.png[/img] 且令[img]http://...原创 2014-11-13 17:48:16 · 8224 阅读 · 1 评论 -
R与指数分布(2) 累积分布函数
累积分布函数,又叫累计分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(Cumulative Distribution Function)表记。对于所有实数x ,累积分布函数定义如下:[img]http://upload.wikimedia.org/math/5/a/b/5ab3ef37703a0f5eda7e17711e8b18fc.pn...原创 2014-11-06 22:08:01 · 3949 阅读 · 0 评论 -
R0-R介绍以及windows下安装R
1 什么是R以及CRANR is ‘GNU S’, a freely available language and environment for statistical computing and graphics which provides a wide variety of statistical and graphical techniques: linear and nonline...原创 2014-06-19 12:14:10 · 323 阅读 · 0 评论 -
R1-R数据类型(1)
R1-R数据类型(1)1 R有五种基本的或者原子的对象类characternumericintegercomplexlogical(True/False)最基本的对象是vector一个vector只能包含同一类的对象。但list表示为一个vector,可以包含不同类的对象。每个vector可以用vector()函数创建。2 NumbersNumbers在...原创 2014-06-20 15:48:23 · 279 阅读 · 0 评论 -
在Windonw下R中安装RMySQL
在Windonw下R中安装RMySQL参考文章http://www.ahschulz.de/2013/07/23/installing-rmysql-under-windows/和http://cran.r-project.org/web/packages/RMySQL/INSTALL我的安装步骤:1 安装RTools2 安装mysql-5.6.20-winx64(Ty...原创 2014-09-12 15:14:02 · 180 阅读 · 0 评论 -
用R进行批量文件的重命名
需求:books文件夹下有xxx.001.zip格式的文件需要去掉.zip后缀实现:[code="java"]folder原创 2014-09-27 16:38:43 · 5239 阅读 · 0 评论 -
R中如何求众数
R中没有直接求众数的函数q1 table(q1)q13 4 5 6 7 8 1 1 3 2 2 1 > max(table(q1))[1] 3> table(q1) == max(table(q1))q1 3 4 5 6 7 8 FALSE FALSE TRUE FALSE FALSE FALSE ...原创 2014-10-10 13:04:05 · 7506 阅读 · 0 评论 -
R与正态分布(1) 概率密度函数
摘自百度百科:正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、方差为σ^2的高斯分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经...原创 2014-10-20 18:12:38 · 8921 阅读 · 0 评论 -
R与正态分布(2) 累积分布函数
累积分布函数为:[img]http://dl2.iteye.com/upload/attachment/0102/2695/e36481d6-9d5e-36e6-ae4d-7f10f7552c3e.jpg[/img][code="java"]set.seed(0)x原创 2014-10-21 17:39:32 · 5325 阅读 · 0 评论 -
R与正态分布(3)分布的检验
Shapiro—Wilk检验法是S.S.Shapiro与M.B.Wilk提出用顺序统计量W来检验分布的正态性,对研究的对象总体,先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序排列编秩,然后由确定的显著性水平α,以及根据样本量为n时所对应的系数αi,根据特定公式计算出检验统计量W。最后查特定的正态性W检验临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分布,否则拒绝假设...原创 2014-10-29 08:29:03 · 761 阅读 · 0 评论 -
R与指数分布(1) 概率密度函数
在概率论和统计学中,指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。概率密度函数一个指数分布的概率密度函数是:[img]http://upload.wikimedia.org/math/7/c/1/7c1e7458e99f77f22c350...原创 2014-10-31 21:51:10 · 10364 阅读 · 0 评论 -
R与χ²分布(3) 分布检验
我们依然用Kolmogorov-Smirnov连续分布检验法来检验一个连续分布是否是服从χ²分布。 原假设为H0:数据集符合χ²分布 研究假设H1:样本所来自的总体分布不符合χ²分布。 令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数. 统计量D为: D=max|F0(x) - Fn(x)| D值越小,越接近0,表示样本数据越接近χ²...原创 2014-11-27 20:54:44 · 899 阅读 · 0 评论