《R语言数据分析》——1.7 小结

本节书摘来自华章出版社《R语言数据分析》一书中的第1章,第1.7节,作者盖尔盖伊·道罗齐(Gergely Daróczi),潘怡 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.7 小结

本章重点探讨了一些乏味但是很重要的工作,这些工作我们可能每天都要完成。对于每个数据科学项目而言,数据导入一定是第一步,因此要掌握数据分析就应该从如何有效地将数据导入到R会话中开始。

但是某种程度上,有效是个很含糊的概念:从技术角度出发,数据装载应该快速以免浪费我们的时间,但同时花几个小时来编程以提高导入的效率也不是那么重要。

本章还对读取文本文件,与数据库系统交互,在R中查询数据子集等问题给出了一些通用的解决方案。读者应掌握当下最流行的几种数据库系统的处理方法,学会选择最适合自己项目的数据库产品,并进行测试,就像我们之前所做的一样。

下一章,我们将更进一步地对这个问题展开探讨,我们将通过从Web和各类API中获取数据的样例对问题进行说明,使读者能够掌握在项目中应用公开数据的方法,即便你还没有获得相应的二进制数据文件或数据库后台。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值