R语言把某些数替换成na_R语言进行数据清洗

微信公众号:Python商务实践
博客网址:www.liupu.top
任何问题和建议,请在博客评论区或公众号留言
最近更新时间:2018-9-26

写在前面

上次更新后已经有将近三个月没有进行文章更新,所以这里要向那些一直关注小编文章的朋友致以最诚挚的抱歉。因为在这三个月中一些琐事以及工作方面的事情一直缠绕着我,使得我总是没有精力或者心情去及时进行文章更新,再次向喜欢小编文章的各位朋友进行道歉!这也让小编感觉到一个人坚持做一件事情是多么的困难。我一直觉得自己还算是具有一种比较能够坚持的性格,然而实践证明,坚持总是说着容易。在反思了这段时间之后,小编决定在接下来的文章更新中尽量做到每周都有更新,不过每周更新的频率将有所调整,小编会尽量做到每周两更,然而考虑到工作人士的身不由己,一周一更也将成为一种常态,但是小编会保证每周都至少会有一篇文章更新,以感激你们这群长期支持小编的朋友。可能太久没有写文章了,所以一时间有点话痨,下面开始介绍一下本期的主题。本期文章中,小编将和大家介绍一下怎么使用R语言去进行数据的清洗以及规整。因为任何形式的数据分析都离不开数据清洗,可以说数据清洗整理占据了整个数据分析工作时间的80%,因此小编一直以来就极为重视这一点。长久以来小编一直使用Python和R进行数据分析,所以小编不可能只介绍R语言的数据清洗过程,也会介绍怎么使用Python去进行同类型的数据清洗工作,因为数据清洗真的比较重要,所以这期文章只介绍怎么使用R语言去进行数据清洗,下期文章介绍Python的处理过程。而本文选择进行清洗的数据来源于美国的UFO观察数据,考虑到数据将有80M的存量,这里就不将数据上传了,需要的朋友请给小编发私信或者留言,小编会及时发给你们!好了,这里就不再多说废话了,下面正式进入主题。

先观察一下数据吧

正如前面小编说过的一样,数据集是一份存量为80M的固定分割文本文件(也就是tsv格式文件),因此使用记事本或者其他程序打开文件真的会需要一点时间(尤其是配置比较差的电脑更是如此),好在我们并没有打算浏览全部数据,我们仅仅需要观察一下数据集的构成与特征,所以这个时候直接使用命令行工具会显得更加方便快捷。如果大家看过小编之前的文章,那么就应该知道怎么去打开命令行工具(windows下存在两种命令行工具:cmd和powershell,打开的方式类似,win+R后输入cmd或者powershell分别打开这两种形式的命令行;苹果电脑下通过command+空格键,然后输入terminal打开命令行终端)。这里小编选择windows系统下的powershell命令行工具进行介绍。在打开命令行工具后,首先将路径转移到ufo数据所在的路径,而后使用查看命令查看文件即可。在命令行窗口中输入以下代码完成查看。

# 改变路径到文件所在路径,小编的文件存放在桌面,所以这里改变路径到桌面cd C:/Users/Administrator/Desktop/# 查看文件前五行内容
head -5 ufo_awesome.tsv   # 记得可以使用tab键补全哈# 如果你的电脑是32位机,上面的head命令可能正常运行,然而如果你的电脑# 是64位机的话,你可能需要用下面的命令,这也是小编推荐的命令:
Get-conten

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值