Datacamp_Cleaning Data in R

我跳过了导入数据这一course,进入到了clean。C1 Introduction and exploring raw dataExplore raw data: class(),dim(),names(),str(),glimpse(),summary()look at your data:head/tail(data,n=)visualize your data:hist(),pl...
摘要由CSDN通过智能技术生成

我跳过了导入数据这一course,进入到了clean。

C1 Introduction and exploring raw data

  1. Explore raw data: class(),dim(),names(),str(),glimpse(),summary()
  2. look at your data:head/tail(data,n=)
  3. visualize your data:hist(),plot()

C2 Introduction to tidy data

什么叫做messy data?比如表头有Y1920 Y1981-gather
总结:

  1. gather,spread,separate,unite
  2. arrange,select,mytate,filter

Gather
gather函数类似于Excel(2016起)中的数据透视的功能,能把一个变量名含有变量的二维表转换成一个规范的二维表(类似数据库中关系的那种表,具体看例子)

第一个参数放的是原数据,数据类型要是一个数据框;
下面传一个键值对,名字是自己起的,这两个值是做新转换成的二维表的表头,即两个变量名;
第四个是选中要转置的列,这个参数不写的话就默认全部转置;
后面还可以加可选参数na.rm,如果na.rm = TRUE,那么将会在新表中去除原表中的缺失值(NA)。
在这里插入图片描述

Spread

spread用来扩展表,把某一列的值(键值对)分开拆成多列。
spread(data, key, value, fill = NA, convert = FALSE, drop =TRUE, sep = NULL)
key是原来要拆的那一列的名字(变量名),value是拆出来的那些列的值应该填什么(填原表的哪一列)
再重

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值