关于R语言读取Excel文件,比较麻烦,我从来都反对直接读取xlsx文件,因为爬虫数据时,一般保存的格式都是csv文件,或者直接保存到数据库里面,没有谁会保存到Excel文件里面。不管是txt文本文件,还是csv逗号分割符文件,都是可用R自带函数读取的,即使对于一般不太大的文件,我们可以将其打开另存为csv文件,当然了,Excel对于超过100万条的数据,也不一定是100万条,这与每一行数据量多少还是有关的,我是没有见过几百万条的Excel文件的,xlsx表格文件一般是拿来做商务报表的,应该没有几百万行的数据吧!
废话不多说,这里还是介绍一下怎么读写xlsx文件吧,毕竟很多人都有强迫症,非要直接读取xlsx文件,尤其是学习数学的,意志力很坚强!
R语言想要处理xlsx文件,需要第三方包xlsx包,而xlsx包又依赖rJava包,因为写xlsx包的这个大牛不想重复造轮子,直接调用了rJava包中的函数,而rJava包需要java环境,所以总结起来需要完成以下三步:
安装jdk提供java语言的开发和运行环境,其实只需要运行环境jre就行了;
安装rJava包;
安装xlsx包
安装jdk
1、去java官网下载jdk安装包,网址:www.java.com或者www.oracle.com都是可以的,java与jdk的关系可以理解为C语言与VC++的关系,我就这样解释。有了安装包,就可以安装了,根据安装向导安装即可