r语言pls分析_R语言缺失值分析:naniar

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言数据高效处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书,《R语言数据高效处理指南》(黄天元)【简介_书评_在线阅读】 - 当当图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

数据存在缺失值的问题在实践工作中屡见不鲜,正确地观察、分析并对缺失值进行合理的处理,是保证数据分析结果有效性的重要前提。一般而言,缺失值分析流程如下:

1、观察哪里缺失(行、列)、缺失多少,是否存在时间序列或空间邻接的连续确实

2、分析缺失原因,数据是如何缺失(随机缺失/非随机缺失)的

3、根据原因,给出处理方案(替换、删除、插补)

a91d59e9d42c5a254d05f457df5b44b9.png

一直以来,R语言社区就对缺失值很有办法。而在R语言的新时代,简洁之风(tidy data)更是为这个过程带来极大的便利。这里只推荐一个R包——naniar。

链接如下:

CRAN - Package naniar​cran.r-project.org https://github.com/njtierney/naniar​github.com Data Structures, Summaries, and Visualisations for Missing Data​naniar.njtierney.com
2d3b5673d7093e108528dab86dba64f7.png

从表格统计到可视化,一应俱全,在开发版本中更是有很多新的特性。这个包可以对缺失值进行观察、分析、替换、插补,而且未来还会更加优秀,是以mark一下,以备不时之需。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值