智齿为什么有人长有人不长,长的概率有多大,为什么我要长智齿!!!
缺失数据的分类
- 完全随机缺失
- 随机缺失
- 非随机缺失
处理缺失数据之前要了解为何会出现缺失数据
1.机器断电,导致某个测量值发生了丢失
2.测量根本没有发生,列如:在调查过程中有些数据没有调查,或者无效
在R中,NA代表缺失值(不可用),有可能是0有可能为任何值
在函数中添加na.rm=TRUE可以跳过缺失值后进行计算,并减少缺失值的个数算总数。
用is.na(x)来检查向量是否含有缺失值,如果有缺失值相应位置上显示TRUE
去掉数据中的缺失值使用na.omit(x)
其他缺失数据
缺失数据NaN,代表不可能的值
lnf表示无穷,分为正无穷和负无穷,代表无穷大与无穷小
不同缺失值之间的差别
NA是存在的值但是不知道是多少
NaN是不存在的
lnf存在,是无穷大或者无穷小,但表示不可能的值。
用is.nan(x)识别不存在的值,is.infinite(x)识别相应的值,返回的也是TRUE or FALSE