![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R
文章平均质量分 65
古韦
这个作者很懒,什么都没留下…
展开
-
第1章:R简介,变量,向量,数组,矩阵,数据框,读写文件,控制流
mode():数据类型原创 2014-08-14 14:38:46 · 1000 阅读 · 0 评论 -
R语言之各种检验
1、W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如0.05)时,则认为 样本不是来自正态分布的总体,否则则承认样本来自正态分布的总体。2、K检验(经验分布的Kolmogorov-Smirnov检验)转载 2014-09-25 10:01:28 · 3004 阅读 · 0 评论 -
孤立点检测的几种方法
又称为异常检测,离群值检测等什么是孤立点?孤立点是一个观测值,它与其它观测值的差别如此之大,以至于怀疑它是由不同的机制产生的孤立点的一些场景1 网站日志中的孤立点,试图入侵者2 一群学生中的孤立点,天才 or 白痴?3 天气数据,灾害,极端天气4 信用卡行为,试图欺诈者5 低概率事件,接种疫苗后却发病的6 实验误差或仪器和操作问题造成的错误数据原创 2014-09-02 15:23:33 · 6997 阅读 · 0 评论 -
主成分分析及R语言实现
概念:Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析成分的保留:Kaiser主张(1960)将特征值小于1的成分放弃,只保留特征值大于1的成分如果能用不超过3-5个成分就能解释变异的80%,就算是原创 2014-09-01 21:27:23 · 2406 阅读 · 0 评论 -
因子分析及R语言实现
概念:降维的一种方法,是主成分分析的推广和发展是用于分析隐藏在表面现象背后的因子作用的统计模型。试图用最少个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量例子:各科学习成绩(数学能力,语言能力,运动能力等)例子:生活满意度(工作满意度,家庭满意度)主要用途:减少分析变量个数通过对变量间相关关系的探测,将原始变量分组,即将相关性高的变原创 2014-09-01 09:46:51 · 5520 阅读 · 0 评论 -
R自带数据包(datasets)
向量euro #欧元汇率,长度为11,每个元素都有命名landmasses #48个陆地的面积,每个都有命名precip #长度为70的命名向量rivers #北美141条河流长度state.abb #美国50个州的双字母缩写state.area #美国50个州的面积state.name #美国50个州的全称因子st转载 2014-08-31 14:36:03 · 1740 阅读 · 0 评论 -
R语言之数据挖掘包
今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天 开始,只要晚上能在11点之前把碗洗好,就花一个小时的时间学习博客上的内容,并把学习过程中记不住的信息记录下来,顺便把离英语四级的差距尽量缩小。下面列出了可用于转载 2014-08-31 14:36:52 · 753 阅读 · 0 评论 -
R语言之常用函数
对一般数据进行运算的常用函数:数学函数:1、round() #四舍五入例:x round(x, 0) #保留整数位round(x, 2) #保留两位小数round(x, -1) #保留到十位 2、signif() #取有效数字(跟学过的有效数字不是一个意思)例:略 3、trunc() #取整 floor() #向下取整 ceili转载 2014-08-31 14:42:00 · 3663 阅读 · 0 评论 -
数据的标准化与中心化以及R实现
数据的标准化与中心化以及R语言中的scale详解转载 2014-08-31 14:08:23 · 4228 阅读 · 0 评论 -
第4章: 多元线性回归模型
设置一个阈值()原创 2014-08-17 10:55:24 · 717 阅读 · 0 评论 -
第3章: 随机变量,密度函数,一元线性回归模型
1、对立事件和互斥事件区别:原创 2014-08-16 10:58:42 · 996 阅读 · 0 评论 -
R语言矩阵(matrix)详解
数据:1 3 9 8 9 80 14 2 7 88 1 22 2131 2 44 9 10 9 10使用矩阵表示1)向量转化为矩阵c—>matrixtmp_matrixtmp_matrixtmp_matrix或者tmp_matrixtmp_matrixtmp_matrix数据:col1 col2 col3 col4 col5 col6 col转载 2014-09-11 14:18:44 · 29461 阅读 · 1 评论 -
R语言实现神经网络算法
题目如下:从函数关系y=x1^2+x2^2产生2000组样本数据,其中1900组作为学习集,100组作为待测集。用R语言建立合适的BP神经网络模型并利用上述学习集进行训练。然后用训练后的神经网络模型对待测集进行预测,画图对比预测值和理想值之间的误差情况我用随机方法产生的数据来做,最后 待测集的图形和和学习集的数据有些差别,但如果学习集的数据足够多的话,就能很好的拟合。不知道我这种做原创 2014-08-28 09:28:29 · 8755 阅读 · 1 评论 -
R语言实现knn算法
今天遇到一个很奇怪的问题,在R中用Knn算法实现数据集iris3聚类时,本来把50份数据按30份训练数据,20份测试数据进行编码时,运行出现错误,说是“训练集和类长度不一致(错误于knn.cv(train, test, cl, k = 3, prob = TRUE) : 'train' and 'class' have different lengths)”,但是仅仅把数据按照25作为训练集,2原创 2014-08-27 18:32:28 · 2167 阅读 · 0 评论 -
R语言绘图详解
除了低级作图命令之外,图形的显示也可以用绘图参数来改良。绘图参数可以作为图形函数的选项(但不是所有参数都可以这样用),也可以用函数par来永久地改变绘图参数,也就是说后来的图形都将按照par指定的参数来绘制。例如,下面的命令:> par(bg="yellow")将导致后来的图形都以黄色的背景来绘制。有73个绘图参数,其中一些有非常相似的功能。这些参数详细的列表可以参阅?pa转载 2014-09-09 15:25:33 · 17671 阅读 · 0 评论 -
第2章:R的数据可视化,各种图表,常用统计量计算
hist()和barplot()的功能差不多,原创 2014-08-15 08:39:30 · 1107 阅读 · 0 评论 -
RHadoop安装与使用
RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据。1G, 10G, 100G, TB,PB 由于大数据所带来的单机性能问题,可能会一去联复返了。RHadoop实践是一套系列文章,主要包转载 2014-11-02 18:12:37 · 1180 阅读 · 0 评论