R语言
文章平均质量分 82
W_chuanqi
这个作者很懒,什么都没留下…
展开
-
R及RStudio下载安装教程(超详细)
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。如果你是一个计算机程序的初学者并且急切地想了解计算机的通用编程,R 语言不是一个很理想的选择,可以选择Python、C或Java。R 语言与 C 语言都是贝尔实验室的研究成果,但两者有不同的侧重领域,R 语言是一种解释型的面向数学理论研究工作者的语言,而 C 语言是为计算机软件工程师设计的。R 语言是解释运行的语言(与 C 语言的编译运行不同),它的执行速度比 C 语言慢得多,不利于优化。但它在语法层面提供...原创 2022-03-21 09:29:12 · 270408 阅读 · 32 评论 -
实验十—基本统计分析(三)
1.调查某大学学生每周学习时间与得分的平均等级之间的关系,现抽查10个学生的资料如student.data文件所示。其中等级10表示最好,1表示最差,试用秩相关检验(Spearman检验和Kendall检验)分析学习时间和学习等级有无关系。(相关性检验)提出假设:H0:学习时间和学习等级无关系H1:学习时间和学习等级有关系得出结论:使用 spearman 方法,p=0.09279>0.05,接收原假设,学习时间和学习等级无关系。原创 2022-11-06 17:27:13 · 643 阅读 · 0 评论 -
实验九—基本统计分析(二)
Consolidated食品公司在新墨西哥州、亚利桑那州和加利福尼亚州经营连锁超市。它举办了一个促销活动,宣传本公司新的信用卡政策,以及顾客在购物付款时除了使用现金和个人支票外,还能够使用诸如VISA卡和Mater卡这样的信用卡。新政策正在试验的基础上实行,公司希望信用卡支付方式能够鼓励顾客多消费。在新政策实行一个月以后,工作人员选择一周时间内的100位顾客作为随机样本,搜集了每位顾客的支付方式和消费金额数据,全部数据在Consolid.csv文件中。原创 2022-11-06 17:25:37 · 453 阅读 · 0 评论 -
实验八—基本统计分析(一)
R自带的数据集Titanic记录了泰坦尼克号上乘客的生存和死亡信息,该数据集包含船舱等级(class)、性别 (sex)、年龄(age)、生存状态(survived)四个类别变量。生成如下数据框df,数据的范围[1,20],并设定y2的第3个和第8个值为缺失值。数据集表示的含义为:7种比较算法的三种评价指标(AE of Best, AE of Mean, AE of worst)今测得10名非铅作业工人和7名铅作业工人的血铅值,如下表所示。c) 将问题b)生成的列联表转化为带有类别频数的数据框。原创 2022-11-06 17:23:21 · 5594 阅读 · 1 评论 -
实验七—高级数据管理(一)
按照课本5.3“数据处理难题的一套解决方案”,生成一组包含10条观测的原始学生花名册(自己设计并生成学生姓名信息,如 Yilong Zhu),math数据由rnorm(10,400,50)随机获得,Science数据由rnorm(10,60,10)随机获得,English数据由rnorm(10,20,5)随机获得。d) 平均成绩90分以上的划分为等级A,90-80分的划分等级为B,70-80分的划分等级为C,60-70的划分等级为D,60分以下的划分等级为E。并调用该函数,输出1-10的阶乘。原创 2022-11-06 17:19:55 · 1013 阅读 · 0 评论 -
实验六—基本数据管理(三)
3.定义字符串data为“R语言是一门艺术”,data1为“用心去体会”,将两字符串进行连接,并用冒号分隔。因为两个向量的长度不同,会按照广播原则将第二个向量扩展为 1 2 3 4 1 2 3 4 1,然后再进行运算。7.调用vioplot包中的vioplot函数绘制如下图所示的data4_1的6项空气污染指标的小提琴图。1.计算2的1-50次方,以及1-50的平方,找出这两个序列有哪些元素是相等的,显示出来。5.) 应收运费计算方法为:1公斤以内,收费15元,超过1公斤,超出部分,每公斤收3元。原创 2022-11-06 17:11:12 · 744 阅读 · 0 评论 -
R语言—基本统计分析
使用sample函数模拟一次投掷一枚骰子的情况,共投掷100次,计算各点数出现的频数。知识:简单随机抽样名称取值与意义x向量,表示抽样的总体size非负整数,表示抽样的个体replace逻辑变量,表示是否为有放回抽样,默认为FALSEprob数值向量(0-1之间),长度与参数x相同,表示x中元素出现的频率。原创 2022-11-06 14:19:03 · 6793 阅读 · 0 评论 -
R语言—随机抽样
其中,x为样本数据, stratanames为分层抽样要使用的变量,size为各层抽取个数,method指的是抽样方法,“srswor”、“srswr”、“poisson”、"systematic"分别指不重置简单抽样、重置简单抽样、泊松抽样、系统抽样,pik指的是各数据包含在样本中的概率,description默认为FALSE,若设置为TRUE则输出样本个数和总体个数。简单随机抽样:从容量为N的总体中,任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。原创 2022-11-06 14:30:00 · 4626 阅读 · 2 评论 -
R语言高级数据管理
其中,myfun为函数名称;arglist为参数列表;大括号中的部分为函数体。例题:定义一个函数first1,找出向量中第一个1出现的位置。return(i)}}}说明:which()产生x中所有值为1的索引,即位置向量。然后取位置向量的第一个元素。自定义函数,输出向量x中能被3整除的数的个数。原创 2022-11-05 09:37:57 · 993 阅读 · 0 评论 -
R语言数据重塑
长数据一般是指数据集中的变量没有做明确的细分,即变量中至少有一个变量中的元素存在值严重重复循环的情况(可以归为几类),表格整体的形状为长方形,即。宽数据格式看重的是一次观测的各个变量相对应的观测值,所以各个变量是重点,而变量数目一般会比观测数多,这样就显得数据集较宽,故称为宽数据。宽数据是我们常见的数据集格式,因为这种格式符合数据收集的习惯和标准,数据集的每一列为一个观测变量,每一行为一组所有观测变量的观测值。宽数据是指数据集对所有的变量进行了明确的细分,各变量的值不存在重复循环的情况也无法归类。原创 2022-11-05 09:34:37 · 848 阅读 · 0 评论 -
R语言—基本数据管理
又比如你在处理数据时遇到缺失的值,这些缺失的值需要去掉,这就需要使用一个索引去找出我们需要的数据或者剔除缺失值或者不需要的数据,学会了以下的方法可以对大部分的数据进行子集处理。rbind函数根据行进行合并,就是行的叠加,m行的矩阵与n行的矩阵rbind()最后变成m+n行,合并前提:rbind(a, b)中矩阵a、b的列数必需相符。但遗憾的是,仅有识别缺失数据是最清晰明确的步骤。R语言会自动跳过NULL值,NULL不考虑,得到的值是其他四个数的平均值,NULL是R的一种特殊对象,它没有模式。原创 2022-11-05 09:31:14 · 2005 阅读 · 0 评论 -
R语言—数据排序
获取mtcars的1-15行以及1:6列数据,使用order()首先按照气缸数量排序,再按照每加仑里程数排序。R语言常用的排序函数包括:sort() order() arrange() rank()在Excel中可以对数据进行的基本操作包括:排序、筛选、分类汇总、创建数据透视表等。说明:order()返回的是排序后生成的向量中的元素在排序前向量中的索引(位置)。关系(即相等的值)和缺失的值可以用几种方法处理。使用函数order()和arrange()对数据框进行排序。原创 2022-11-05 09:26:06 · 3974 阅读 · 0 评论 -
R语言—因子
暂时将x进行分组,每组对应一个因子水平(在多重因子的情况下对应一组因子水平的组合),得到x的子向量,然后这些子向量应用函数g()。通过factor函数的参数levels指定水平,否则,默认来源于因子向量。split(x,f):将x按照因子f或者列表进行分组,然后返回分组的列表。将“income”按“gender”和“over35”组成的列表进行分类。说明:plot函数的数据集如果是向量,则输出散点图。说明:plot函数的数据集如果是因子,则输出条形图。将“income”按“gender”进行分类。原创 2022-11-05 09:24:08 · 3989 阅读 · 0 评论 -
R语言—列表
列表是由一些对象的有序结合所构建的对象,其中的每个对象称为列表的分量(component),它们的长度和类型可以不同。列表是R的数据类型中最为复杂的一种。列表是一些对象(或成分component)的有序集合。列表允许整合若干对象到单个对象名下列表中可能包含向量,矩阵,数据框,甚至其他列表列表类似于C语言的结构体类型,Python中的字典类型。从技术上讲,列表就是向量。之前我们接触的向量称为“原子型”向量,即向量的元素是最小的,不可再分的。而列表属于递归行向量。原创 2022-11-05 09:19:59 · 2328 阅读 · 0 评论 -
R语言—数据框
数据框就是数据库中的数据表,每一行称为一条记录,每一列称为一个属性。数据框类似于C语言中的结构体,用C语言存储上述内容,使用结构体数组。生成数据框,三门课程的成绩为区间0-5之间服从均匀分布的随机数,保留1位小数。先提取前两行,然后提取第1列和第3列通过组件的索引值来访问组件。,并使用rbind()函数,其实也就是对两个相同结构的数据框进行。第一个访问使用的是两个中括号,第二次访问使用的是一个中括号。数据框的成分由各个变量组成,每个变量可以自行命名。可以给新创建的列命名,这样会更清晰一些。原创 2022-11-05 09:16:29 · 3364 阅读 · 0 评论 -
R语言—数组
其中数组元素的填入次序是第一下标变化最快, 第二下标次之, 最后一个下标是变化最慢的。这种次序称为FORTRAN次序。向量是1维数组,矩阵是二维数组,数组的维数可以大于2。可以想象为一个长宽高分别为2,5,2的长方体。选取第2个矩阵中索引为[1,1]的元素。选取第二个矩阵的第2列和第3列。相当于2个2×3矩阵。选取数组的第一个矩阵。原创 2022-11-05 09:14:26 · 1926 阅读 · 0 评论 -
R语言—矩阵
apply()函数系列是R中最受欢迎同时也是最常用的函数族,包括apply(), tapply(), 和lapply()。z%%2==1,返回一个逻辑向量 TRUE FALSE TRUE,x[z%%2==1,]选取对应的行,即第2行、第3行。又使用了与运算符,选择同时满足两个条件的第3行,最后返回第3行的元素。m[,1]>1 选取第1列大于1的行,符合要求的有2、3行。m[,2]>5 选取第2列大于5的行,符合要求的只有第3行。参数x表示要转换成矩阵的向量,value是表示维数的向量。原创 2022-11-05 09:11:32 · 3123 阅读 · 0 评论 -
R语言—向量
R 语言最基本的数据结构是向量。类似于数学上的集合的概念,由一个或多个元素构成。向量其实是用于存储、、或数据的。原创 2022-11-05 09:09:09 · 3833 阅读 · 0 评论 -
R语言中的取整函数
用来取整的四个函数:ceiling floor round trunc,注意四者的区别。原创 2022-10-21 08:59:44 · 6139 阅读 · 0 评论 -
实验二 创建数据集(一)
3.) 使用barplot()绘制条形图,配色方案可选择heat.colors, rainbow,topo.colors等。实验目的:掌握R语言的多种数据存储结构,掌握向R中导入基本格式的数据的方法,掌握为变量和变量代码添加描述性的标签。3.)使用points()和apply()绘制均值点,col=”black”,cex=1,pch=3。1.) 生成10个服从均匀分布(或者正态分布)的随机整数,范围60-100,表示学生成绩。2.)使用data4_1数据集中的4-9列绘制箱线图,boxplot函数。原创 2022-10-21 07:47:41 · 510 阅读 · 0 评论 -
实验五 基本数据管理(二)
2.) 使用函数par(mfrow=c(1,2),mai=c(0.1,0.6,0.1,0.6),cex=0.8)设置布局为1行2列的矩阵,参数mai设置以数值向量表示边界大小,顺序为"下、左、上、右",单位为英寸。8 将mtcars数据集中的前6行存储在数据集mydf中,调用fix()打开交互式编辑器,将wt修改为“weight”.使用rename函数将vs修改为“Engine”。实验目的:操纵日期和缺失值,熟悉数据类型的转换,掌握变量的创建和重编码,掌握数据集的排序、合并与取子集,掌握选入和丢弃变量。原创 2022-09-26 13:09:43 · 455 阅读 · 1 评论 -
实验四 基本数据管理(一)
对年龄字段进行重编码,将age中年龄=30 and 年龄=40的重编码为elder,结果如下图所示。2.)用函数data.frame()创建一个数据框,第1列名为letters,包含a-h这8个字母,第2列名为numbers,包含1-8数字。d. 数据排序,可以使用order()函数对数据框进行排序,默认为升序,在排序变量前加一个减号,可以降序排列。7.) 随机生成10个50以内的自然数,使用order函数获取元素的索引在排序后的位置。原创 2022-09-18 14:31:23 · 1002 阅读 · 0 评论 -
实验三 创建数据集(二)
5.随机产生一个包括负数和正数的整数向量,元素的范围为-50,50,向量元素个数为10,负数采用1-负数替代,即-3变成4,正数用1+正数替代,即2变成3,怎么编写代码?,其中第1列全为1,第2列为向量x,第3列的元素为x2,并给矩阵的3列命名,分别为Const, Univariate和Quadratic。7.向量x=c(“我”,“你”,“我”,“我”,“你”,“他”,“们”,“他”,“人”)中,统计向量x中的字出现的次数。8.构建一个向量x,向量由5个1,3个2,4个3和2个4构成。原创 2022-09-18 14:29:07 · 1132 阅读 · 0 评论 -
R语言layout () 函数
📋 个人简介💖 作者简介:大家好,我是W_chuanqi,一个编程爱好者💬 愿你我共勉:“若身在泥潭,心也在泥潭,则满眼望去均是泥潭;若身在泥潭,而心系鲲鹏,则能见九万里天地。”✨✨✨。原创 2022-09-06 22:18:41 · 3677 阅读 · 2 评论 -
实验2 创建数据集(一)
3.) 使用barplot()绘制条形图,配色方案可选择heat.colors, rainbow,topo.colors等。实验目的:掌握R语言的多种数据存储结构,掌握向R中导入基本格式的数据的方法,掌握为变量和变量代码添加描述性的标签。1.) 生成10个服从均匀分布(或者正态分布)的随机整数,范围60-100,表示学生成绩。使用R语言基础包中的graphics包中的boxplot函数绘制箱线图。2 张硕 Male 2001-12-12。将第3行第2列的值修改为“Female”......原创 2022-08-31 10:23:10 · 646 阅读 · 0 评论 -
实验1 熟悉R语言环境
(10) 使用barplot()绘制图(a),参数density=30,angle=0,分别设置填充密度和密度线的角度。请登录R的主页(https://www.r-project.org),了解R的最新动态,查看MASS包的版本信息,作者信息等。(9) 使用par()设置图形的边距和字体大小:par(mai=c(0.6,0.6,0.4,0.1),cex=0.7)(13) 通过改变barplot()参数,如angle,观看图形的变化。实验目的:掌握R语言的实验环境,掌握R的安装,R包的安装,载入与使用。...原创 2022-08-29 15:03:49 · 2033 阅读 · 0 评论 -
1.R语言介绍
R语言是从S语言演变而来的解释型语言。S语言是二十世纪70年代诞生于贝尔实验室。1995年新西兰奥克兰大学统计系的Ross Ihaka和Robert Gentleman编写了一种能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。R是对S语言的继承与发展。R系统是开源、免费的,由R开发核心小组负责其开发及维护。R语言是彻底面向对象的统计编程语言。R语言可在多种操作系统上运行,如Windows、MacOS,多种Linux和UNIX等。原创 2022-08-23 22:45:32 · 744 阅读 · 0 评论 -
ggplot2安装失败解决方案
今天在学习R语言的时候,在安装 ggplot2 时出现了异常。安装 ggplot2 成功。原创 2022-08-22 13:19:04 · 4594 阅读 · 0 评论