R语言学习笔记<数据类型>

原创 2015年11月17日 19:33:38

数据类型:

①向量。向量是R中最重要的类型。有c(),seq()等方法可以构造。

②矩阵(数组)

③因子(factor)

④数据框(frame)

⑤函数


因子:有序因子和无序因子

因子是一种向量对象,它给自己的组件指定了一个离散的分类(分组),它的组件由其他等长的向量组成。

函数factor()创建一个因子 : statef <- factor(state)

levels(statef)可以观察因子中有多少不同的水平。

tapply(state,statef,function):对第一个参数的组件中所包含的每个组应用一个函数function,函数的结果是一个长度与因子水平数相等的结果。

table():求因子出现的频数。


数据框:read.csv()返回的是data.frame类型,查看类型用class()函数。

data.frame选子集操作(which):chafer.data[which(chafer.data["xxx"]==3),]选取chafer.data中xxx的值为3的所有的行。返回的类型也是data.frame

如何自定义一个data.frame?

一开始指定列名和数据:data.frame(年龄=c(22,23,20),身高=c(170,159,168))

修改列名:colnames(xxx) <- c(“年龄(岁)","身高(cm)")



read.csv和read.table读取外部数据

read.table(file, header = FALSE, sep = "", quote = "\"‘", dec = ".", skip = 0, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#")

①file表示要读取的文件。file可以是绝对路径或者相对路径,但是一定要注意,因为在R语言中\是转义符,所以路径分隔符必须写成\\或者写出/,比如“C:\\myfile\\myfile.csv”或“C:/data.csv”.
②可以使用剪切板的内容,可以用于读取excel格式的文件,将要读取的数据进行复制,然后在R中输入data<-read.table("clipboard",T)即可.
③使用file.choose(),弹出对话框,让你选择文件位置。推荐使用此种方法,免去了记忆和书写文件路径的麻烦,特别是能够避免因数据文件位置移动带来的错误!
例如:read.table(file.choose(),...).

write.csv和write.table写入数据到外部

Alternatively, you can use choose.files() to get a little more of the typical Windows "Save as" behavior:

  1. Allow the user to define a filename which doesn't exist yet
  2. Add a caption to the dialogue box
  3. Default to .csv file type without the user having to type it

     write.csv(tweets, file=choose.files(caption="Save As...", filters = c("Comma Delimited Files (.csv)","*.csv")),row.names=FALSE)
     #row.names表示是否需要行名,默认行名是1,2,3,4...  修改行名使用row.names(tweets) <- c("xx","yy",...)
这种方法允许让用户自定义一个不存在的文件名,并给一个提示框,且默认是csv文件格式保存。强烈推荐该方法。对于xlsx文件,可以先另存为.csv文件,然后用read.csv()打开。


要修改某一列的类型,比如要修改为numeric,则需要如下方式

subcollection$证券余额 <- as.numeric(as.vector(subcollection$证券余额))

而不是:

subcollection$证券余额 <- as.numeric(subcollection$证券余额)



另外两个技巧:

①不显示warning的方法:options(warn =-1),默认warn =0设置为-1就不会显示了。

②调用外部R并执行: source("D:\\Chafer\\test.R")


如何在R中查看数据类型

> mode(x) [1] "list"
  • Kathrine_Shu
  • Kathrine_Shu
  • 2017年01月14日 18:02
  • 6089

R语言数据类型转化

R语言数据类型转化 转自:http://www.wangluqing.com/2014/09/10/r-share34/ 有时候,对于一些问题,需要进行数据类型之间的转换。R提供了基本类型...
  • g863402758
  • g863402758
  • 2016年11月29日 10:10
  • 4141

R语言的数据类型和对象类型

 数据类型:一个变量内元素取值的类型。主要包括:数值型、字符型、逻辑型、复数型。 对象类型:R语言组织和管理内部元素的不同方式。主要包括:向量、矩阵、数组、列表、数据框、因子、时间序列。 ...
  • amy_diary
  • amy_diary
  • 2016年11月29日 17:06
  • 3803

《R语言实战》第五章学习笔记

感谢Robert I.Kabacoff 著作本书,同时感谢高涛、肖楠、陈钢编译此书。  最近在学习《R语言实战》,特将学习过程记录下来,供各位朋友参考,虽说是笔记,但是90%是书中内容,另外10%是...
  • qq_34773726
  • qq_34773726
  • 2016年09月24日 00:19
  • 305

R语言学习笔记——R语言绘图

###############test1############################## ############### graph test 2014.04.03 ###########...
  • cleverbegin
  • cleverbegin
  • 2014年04月05日 11:08
  • 1303

R语言与点估计学习笔记(EM算法与Bootstrap法)

一、EM算法       EM算法是一种在观测到数据后,用迭代法估计未知参数的方法。可以证明EM算法得到的序列是稳定单调递增的。这种算法对于截尾数据或参数中有一些我们不感兴趣的参数时特别有效。  ...
  • u014032673
  • u014032673
  • 2015年04月20日 08:57
  • 946

《R语言实战》第六章学习笔记

感谢Robert I.Kabacoff 著作本书,同时感谢高涛、肖楠、陈钢编译此书。  最近在学习《R语言实战》,特将学习过程记录下来,供各位朋友参考,虽说是笔记,但是90%是书中内容,另外10%是...
  • qq_34773726
  • qq_34773726
  • 2016年09月24日 00:20
  • 757

R语言的数据类型和数据结构

1. 把R语言操作界面修改为英文 在中文环境中安装R语言编译器,安装语言选择为英文,但是安装好之后还是中文界面。手动修改语言的方法为:右键点击桌面上R的快捷方式,选择属性,目标栏,在“....Rgui...
  • cheryl1116
  • cheryl1116
  • 2015年10月24日 17:47
  • 452

R语言学习笔记(五)

总结下第七章的统计分析方法,里面涉及到了很多统计专业概念。 Summary 函数> myvars> summary(mtcars[myvars])      mpg              hp  ...
  • ghostbear
  • ghostbear
  • 2017年05月01日 15:42
  • 1840

R语言与机器学习学习笔记

人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自...
  • sparkR
  • sparkR
  • 2014年08月19日 16:53
  • 1861
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:R语言学习笔记<数据类型>
举报原因:
原因补充:

(最多只允许输入30个字)