R
文章平均质量分 51
Megajojo
人家小侨
展开
-
#R# #gsub()# #正则表达式学习1#
gsub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)grep(pattern, x, ignore.case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, useBytes = FALSE,...原创 2018-07-26 16:41:15 · 5353 阅读 · 0 评论 -
R语言独立性检验-基础
一。介绍三种检验独立性方法1.卡方独立性检验用chisq.test()函数对二维表的行变量和列变量进行卡方独立性检验。> library(vcd)> mytable <- xtabs(~Treatment+Improved, data=Arthritis)> chisq.test(mytable) Pearson's Chi-squared test...原创 2018-09-10 14:31:07 · 7801 阅读 · 0 评论 -
频数表&频率表
一。基本概念1.频数表是将数据集按照某个特定列分类(分组)时观察每个类/组中数据出现次数的表;2.列联表是观测数据按两个或更多属性/定性变量分类时所列出的频数分布表,是由两个以上的变量进行交叉分类的频数分布表;3.频数也称“次数”,对样本数据按某些属性进行分组,统计出各个组内含个体的个数,就是频数;4.一维列联表就是频数分布表;5.列联表分析的基本问题是:观察各属性之间是否独立...原创 2018-09-10 13:53:19 · 8190 阅读 · 1 评论 -
R语言 描述性统计分析1
以下为学习《R语言实战》笔记。1.方法对于基础安装,summary()提供最大值、最小值、四分位数和数值型变量的均值,及因子向量和逻辑向量的频率统计 Hmisc包的describe()可返回变量和观测的数量、缺失值和唯一值得数目、平均数、分位数,及五个最大的值和五个最小的值。 pastecs包的stat.desc(),使用格式:stat.desc(x, basic=TRUE, de...原创 2018-09-04 11:20:16 · 11427 阅读 · 0 评论 -
R语言中 数据读取与写入
R中其他读取:source #读取R代码dget #读取R文件load #读取工作空间一。R语言读取文本文件(.txt)在R语言中,读取文本文件的函数可以是:read.table()、scan()、read.fwf(),也可以将.txt转换为.csv或.xlsx文件用其他函数读取。1. read.table()参数解释:file:字符型,用""分隔,...原创 2018-08-21 15:10:20 · 31652 阅读 · 0 评论 -
R语言中变量命名规则与反引号的使用
反引号是针对不符合命名规则的变量名/参数名使用的,那么什么是命名规则呢?变量名称可包含英文字母、数字、下划线和英文点号(句号) #所以不能有中文、空格、-存在哦 不能以数字或下划线开头 #开头必须是英文字母或者点 可以以点号开头,但点号后面的符号不能是数字 再之前笔记中提到check.names参数的用法,即:读取数据时,check.names = T表示检查变量(...原创 2018-08-13 15:01:37 · 18702 阅读 · 2 评论 -
R语言中 attach()与detach(),及with()的使用
attach(what, pos = 2L, name = deparse(substitute(what), backtick=FALSE), warn.conflicts = TRUE)1.attach()是对what添加路径索引,避免重复输入what名称,参数解释如下:what:数据框或列表; pos=2L:添加的路径存储的位置,一般默认即可。在对多个数据添加索引时...原创 2018-08-13 14:22:54 · 23533 阅读 · 0 评论 -
数据变量名修改
fix()可以针对矩阵或数据框直接单击弹出的编辑器对话框对变量名进行手动修改; reshape2包是reshape包的重写,其中rename()函数针对数据框和列表修改其变量名,不可修改矩阵变量名; names()功能与rename()相同,不同之处在于names()会修改原数据集中变量名,而rename()不会; colnames()与rownames()可以修改矩阵或数据框的列名与行名,...原创 2018-08-13 10:31:38 · 2095 阅读 · 0 评论 -
R语言 公共参数列表par()手册
初用R,发现在用基础包绘图时不同的画图函数中很多参数都通用的,每次遇见都要去R中查help文件,所以在此借鉴论坛中优秀的par解说,整理成手册,加深自己记忆的同时,方便以后查找参数~par参数涉及颜色、字体、线条和符号、坐标轴、添加图例、组合作图等。参数分为三类:一、仅仅用于询问不能被设定的参数:cin,cra,csi,cxy,dim。二、仅能通过par()设定参数:ask,f...原创 2018-08-15 16:24:41 · 8673 阅读 · 0 评论 -
R语言aggregate函数
aggregate函数可以按照要求把数据打组聚合,然后对聚合以后的数据进行加和、求平均等各种操作。通过by设置分组因子,可以用多个类型的因子,可参见https://www.cnblogs.com/cloudtj/articles/5528903.html待整理常规例子如下:对矩阵按照性别对年龄和身高求平均值...原创 2018-08-14 16:33:04 · 35748 阅读 · 0 评论 -
R语言中 layout函数
layout函数用于组合输出图,语法如下:参数解释:mat:是矩阵,非0数字代表绘制图形的顺序,相同数字代表占位符;”0”代表空缺,不绘制图形; widths = rep.int(1, ncol(mat))各列宽度,与heights = rep.int(1, nrow(mat))各行高度,从下面例子理解; respect:逻辑值或矩阵,矩阵的话必须与mat维度一致,矩阵中每个值必须...原创 2018-08-14 15:42:20 · 11250 阅读 · 2 评论 -
R语言读取excel文件并且保存成csv文件
library(openxlsx)#设置工作空间setwd('F:/')#获取excel中工作簿的名称sheetnames<-getSheetNames('test.xlsx')#把每个工作薄的数据按照'工作薄名称.csv'的名称存储for(i in (1:length(sheetnames))){ write.table(read.xlsx('F:/test.xlsx...转载 2018-08-14 09:53:59 · 9907 阅读 · 0 评论 -
R语言-相关
相关系数是可以用来描述定量变量之间的关系。相关系数的符号()是表明关系的方向(正相关或负相关),其值(绝对值)大小表示关系的强弱程度(完全不相关时为0,完全相关时为1)。一。相关的类型1.Pearson、Spearman和Kendall相关Pearson积差相关系数衡量了两个定量变量之间的线性相关程度 Spearman等级相关系数衡量分级定序变量之间的相关程度,又称为秩相关系数。利用...原创 2018-09-11 15:34:50 · 2478 阅读 · 0 评论