R语言基本数据结构包括:向量、因子、列表、数组、矩阵和数据框。
-
向量
向量是R的基本数据结构
向量存储一组有序的值,称为元素
一个向量可以包含任意数量的元素,但是所有元素必须为同一类型。
基本向量类型:
(1)integer 整型,没有小数的数字
(2)double 双精度浮点类型,即包含小数的数字
(3)character 字符型,文本数据
(4)logical 逻辑型,取值为 TRUE 或 FALSE
(5)特殊值 NULL 表明没有任何值;NA 表明缺失值
用typeof()可以确定向量的类型,class()也行但是...
部分R函数把integer 和double 类型的向量都报告为numertic,如上面的class()。
所有double类型的向量是numeric类型的,但并非所有numeric类型的向量是double类型
向量的赋值
向量名 = c(元素1,元素2,...) (=也可以用箭头运算符”<-“)
通过 向量名[ 序号或序号序列] 访问向量元素,序号从1算起
通过 向量名[ -序号 ] 排除某元素
运算:
为对应元素间运算
若两向量长度不一致,会将短向量重复连接成和长向量长度一致再运算,
> c1
[1] 1 2
> c2
[1] 1 2 3 4 5 6
> c1+c2
[1] 2 4 4 6 6 8
当长向量长度不是短向量长度的倍数时会警告
2. 因子
因子是向量的一个特例,用来标识分类或有序变量
> gender=factor ( c ( "man