如何从R中获得免费的小型数据集

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">相信喜欢数据分析与挖掘的朋友们有时也会遇到这样的问题:在学习了一些数据分析的技术后,想找一些数据来进行练习,但是却找不到合适的数据集。我为此也烦恼了很久,在网上搜索“哪里可以得到免费的数据”,有很多推荐的开放数据的网站,可是进去一看,首先大多是英文的网站,想找到下载数据的地方都不容易,另一方面,开放的数据集一般都很大,而我们做练习可能并不需要这样大型的数据集。在这里,我就为大家推荐一个获得免费小型数据集的方法。</span>

这里有一个前提条件,就是你得安装R。R是什么我就不多介绍了,我们能够得到的小型数据集就蕴藏在R语言的Package中。使用install.packages("somepackage")命令就可以安装一个包,然后通过data(package="somepackage")命令可以看到该包里面自带的数据集。如果是下载的第三方包,在使用之前需要用library(somepackage)加载该包。

那么加载包之后如何导出里面的数据集呢?我在这里以reshape2包中的tips数据集为例,大家在交互命令行一词输入以下命令即可看到tips数据集出现在弹出的窗口中:

install.packages("reshape2")
library(reshape2)
data(package="reshape2")

接下来就是加载该数据集:

data(tips)
这样tips数据集就会出现在变量环境中,并显示为<Promise>,然后用如下命令将<Promise>消除:

tips <- tips
然后进入文章最关键的部分——导出数据为csv格式文件(其他格式也是类似的),这里用到一个简单的命令叫做write.table:

write.table(tips, file="tips.csv", sep=",", row.names=False)
这样,一个叫做tips.csv的数据集文件就出现在R的当前工作目录下了。如果你找不到这个目录,可以在导出文件之前先修改工作目录,使用如下命令:

setwd("filepath"), 比如setwd("C:/Users/Administrator/Desktop")

然后再用write.table进行导出,就可以很方便的找到数据集的存放位置了。

另外,使用write.csv(tips, file="tips.csv")也可以导出数据集,有兴趣的朋友可以试一试,看看和write.table的方式有什么区别。


文章介绍的方法非常简单,我主要是为了防止自己忘记才开始尝试写BLOG,希望各位不要耻笑。


  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值