基本数据管理
直接上小示例:
![]()
以上是实现数据sumx和meanx整合到原始mydata数据框中的两种实现方式,建议用第二个
还有一个问题,就是重编码,也就是给已有的数据赋予新值,比如有个999岁的人,此处记录是错误的,要将其设置为缺失值,可以使用如下代码:
leadership age[leadership age==99] <-NA
其中:variable[condition]<-expression当且仅当condition的值为TRUE时进行赋值
![]()
改变变量的名称:
![]()
或者直接调用fix(leadership),会直接出来一个对话框,可以鼠标进行修改
![]()
如果使用reshape也可以直接使用names,names(leadership)[2]<-“testDate”
结果如下:
![]()
![]()
NA:not available,不可用
NAN:Not a Number,非数值
![]()
对于缺失值,可以忽略掉,不然容易影响结果:
![]()
然后,也可以使用na.omit()来删掉不完整的观测:
![]()
![]()
数据类型转换:
直接列举函数:
![]()
数据排序:
![]()
还有一类,就是用sql进行数据查询和处理,这部分应用比较简单,这里不讲了,网上可以搜到。