R语言
文章平均质量分 63
广州接入
毕业于北京交通大学计算机系,一直从事企业应用开发,有十多年的SaaS平台产品研发经验。擅长系统架构,需求分析。
展开
-
R语言学习系列(概念理解1)
统计分析一般是针对批量数据,如何反映这批数据的特征,是做数据分析的根本目的,对于这些目标数据集合而言,类型其实是没有限制的,但为了能进行更好的分析,特别是利用数学的方法进行,一般都会将这些数据数字化和量化.因此一般情况下,我们统计分析的指标都可以定在数量上.那如何刻画这些数据的特征呢?平均值: 这是最简单的一个指标,这个指标反映的是数据的平均水平或能力,其优点是简单易算,但缺点也很明显,一是不能反原创 2012-05-14 16:18:24 · 3240 阅读 · 1 评论 -
R语言矩阵运算
R语言矩阵运算 主要包括以下内容:创建矩阵向量;矩阵加减,乘积;矩阵的逆;行列式的值;特征值与特征向量;QR分解;奇异值分解;广义逆;backsolve与fowardsolve函数;取矩阵的上下三角元素;向量化算子等. 1 创建一个向量在R中可以用函数c()来创建一个向量,例如:> x=c(1,2,3,4)> x[1] 1 2 3 4 2 创建一个矩阵在R中可以用函数matrix()来创建转载 2012-07-22 21:33:19 · 57714 阅读 · 3 评论 -
对淬火算法,神经网络和遗传算法等算法的一点思考(欢迎探讨)
这些算法看起来有点瞎猜的味道,但实际上我觉得都做了如下假设:1)因变量和自变量之间存在一定的函数关系;2) 自变量对因变量的影响是连续的.其实这种假设包含的是经典时空理论下的运动假设,即:运动是有轨迹的,或者说运动是连续的,体现在前面的函数关系上,就是自变量的微小变化引起的自变量变化也是微小的(极限理论).虽然在很多时候,我们观察的结果看起来是不连续的,比如量子力学中的电子运动,但我们还是假定这种原创 2012-07-19 22:37:08 · 5168 阅读 · 0 评论 -
R语言学习系列(数据挖掘之决策树算法实现--ID3代码篇)
1、辅助类,用于计算过程和结果存储/// /// 决策树节点. /// public class DecisionTreeNode { /// /// 类型:分支或叶子 /// public string Type { get; set; } ///原创 2012-07-18 21:26:05 · 15922 阅读 · 6 评论 -
R语言学习笔记(概念、公式及R函数)
1、随机实验:可在相同2、随机事件均值u:这个很好理解 R函数:mean中位数:对序列排序后,排在中间的数,需要特别注意的是如果序列为偶数,中位数是中间两个数平均值. R函数:median百分位数:也是顺序统计量,设百分数为p,n是样本个数,则p位数指:np为小数,ceiling(np)+1,np为整数,则p位数:(x[np]+x[np+1])/2. R函数:quantile()方差s^2,标准原创 2012-08-03 16:43:28 · 42923 阅读 · 0 评论 -
R语言系列学习(各种检验)
1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为 样本不是来自正态分布的总体,否则则承认样本来自正态分布的总体。2、K检验(经验分布的Kolmogorov-Smirnov检验) R函数:ks.test(),如果P原创 2012-06-20 15:23:55 · 59642 阅读 · 0 评论 -
R语言学习系列(来点实际的分析样例)
这是我辛辛苦苦搞来的数据,说明一下,国内生产总值来至于国家统计局(2011年除外),M2来自网络。 首先画散点图: 图什么意思,你懂的。对M2和年份做拟合,当然是指数级的(从散点图可以看出)> lm.sol> summary(lm.sol)Call:lm(formula = log(M2) ~ 年份, data = DT)Residuals: Min 1Q Median原创 2012-06-20 11:22:53 · 13309 阅读 · 3 评论 -
R语言学习系列(极大似然法)
第4章看得确实比较费劲,主要还是栽倒数学功底上了,极限求值,微分等东西早还给老师了,所以理解起来很困难。后来补了点高数,总算搞明白了。似然函数其实就是密度函数的变量常量化,参数变量化,然后求极大值点下的参数值作为参数估计值(前提当然是必须有极大值存在,连续,一阶导存在),因此需要对似然函数求一阶导,得出似然方程或者对数似然方程。对于一个参数的求起来比较容易,对于两个参数的,需要先固定一个参数变量求原创 2012-05-23 21:19:48 · 7374 阅读 · 1 评论 -
R语言学习系列(画向量的密度直方图)
利用R语言画密度直方图比较方便,但为了理解密度函数的意义和如何计算密度值,于是用plot,lines两个画图函数来自己实现密度直方图的画图程序脚本如下:DrawDensity = function(x,bw=5){ if(any(bw<=0)) { bw <- 5 } #print(bw) n <- length(x) i原创 2012-05-18 21:18:17 · 13384 阅读 · 0 评论 -
R语言学习(概念理解2)
1、服从大数定律 如果当n足够大时,随机变量序列的算术平均值Y等于Y的期望地概率为1。 满足这个条件就可以说这个随机序列服从大数定律。2、Bernoulli大数定律 事件A的概率为p,当实验次数n足够大时,事件A出现的次数与n的比值等于p的概率为1,其实也就是说,但实验次数n足够大时,A出现的频率可以看作其出现的概率。 频率稳定于概率.3、Chebyshev(切比雪夫原创 2012-07-26 19:09:18 · 4326 阅读 · 0 评论