检查变量和工作区
类简介
R中所有变量都有一个类,使用class函数查看变量类别。
- 数字
浮点值(numeric)、整数(integer)、复数(complex)
默认类型为numeric,如数字1为numeric,1L则为integer。
-
类别数据——因子factor
因子是具有标签的整数,标签的取值范围称为因子水平。比如设定性别因子gender有male、female两类,则因子水平为male和female。levels函数查看因子的水平,nlevels查看因子水平个数,因子的值存储为整数而非字符,在出现大量重复字节时可使内存高效。 -
数据框(dataframe)
既像矩阵一样是矩形,又像列表一样,每一列可以有不同的类型。使用data.frame生成数据框。 -
其他
存储二进制数据的原始值(raw)、字符(character)、逻辑值(logical)
查看和更改类
如在脚本中测试对象的类型,最好使用is,通常情况下,使用每个类对应的is* 函数,如 is.character 判断是否为字符,返回值为逻辑值。同理,类型转化时,常使用 as*,如as.numeric。
ls(pattern="^is",bassenv()) #查看base包中所有is函数
ls(pattern="^as",bassenv()) #查看base包中所有as函数
is.numeric对整数和浮点数都返回TRUE,如果只测试浮点数,使用is.double
将一个向量转化为数据框时,使用as.data.frame不要使用as,不然会报错。
检查变量
summary函数提供汇总信息
head显示数据的前几行,默认6行
str显示对象的类型和结构
attribute显示对象所有属性列表
View通过只读的方式将变量显示为电子表格
ls列出现有变量的名称,可匹配与pattern模式相同的字符串。变量名以 点(.) 开头的为隐藏文件,要查看它们,需传入 all.names=TRUE
ls.str 查看变量名称和结构
rm 删除工作区变量
rm(a) #删除a
rm(list=ls()) #删除所有变量
object.size函数查看每个对象的大小
letters小写字母,LETTERS大写字母,均为R内置函数