复习篇-
1.数据类型
numeric:包含integers(整数型)和double-precision(双精度型).默认是双精度型数据
character:这种数据形式是夹在双引号或单引号之间的字符串.
logical:取TRUE or FALSE
complex:形如a+bi型的复数
raw(原始型):二进制形式保存数据
missing value(默认值):当一个元素或值在统计的时候是”不可得到的” (NA)或“缺失值”(missing value)时,相关位置可能会保留并且赋予一个特定的NA;任何NA的运算结果都是NA,is.na()函数用来检测数据是否缺失,返回结果是逻辑值。
常见的辨别和转换数据对象类型的函数有:
数据类型 | 辨别函数 | 转换函数 |
---|---|---|
character | is.character() | as.character() |
numeric | is.numeric() | as.numeric() |
NA | is.na() | as.na() |
double | is.double() | as.double() |
integer | is.integer() | as.integer() |
complex | is.complex() | as.complex() |
logical | is.logical() | as.logical() |
2.数据对象
R中的数据对象主要有6种结构:向量(vector)、矩阵(matrix)、数组(array)、因子(factor)、列表(list)和数据框(data.frame)
其中R在进行运算时或有些缺陷,微小的数字或巨大的数字在运算时经常会出现一些意外,浮点数在计算机中的表达有限,不能以任意精度存储.例如:
0.4-0.7+0.3==0
[1] FALSE
> 0.0000003-0.0000007+0.0000004==0
[1] TRUE
因此,在处理R里面的数据时,尤其在判断时,需要特别注意精度问题.
2.1向量
- 向量的赋值:
c()函数可以把参数首尾相连形成一个向量
对于字符型向量,函数paste()可以把对应元素连成一个字符串,长 度不同时,较短的向量会被重复使用.
此外,也可以用assign()函数对向量进行赋值. - 向量的运算
对于向量的乘法、除法和乘方运算,其方法是对应向量每一个分量做运算。出现在同一个表达式的向量最好同一长度,如果长度不一,则表达式中短的向量将会被循环使用,结果中会有警告信息。此外,”%%”表示整数除法(5%%3=1),”%/%”