用R合并从某网下载的专利文件分析时出现了错误,看了好多高人的帖子,都没有解决问题,最后好容易才从坑里爬出来。现将经验分享如下:
1)用openxlsx包可以访问xlsx文件,但不能访问xls文件。
2)用ROOBC包,不仅要在32位电脑操作,且读取文件时也出现很难纠正的故障。
3)用xlsx包不开下载的xls文件。
4)用readxl包打不开下载的xls文件。
5)用gdata包,装上Perl后可以打开示例iris.xls文件,但打不开下载的xls文件,将示例文件iris.xls的英文改中文也出现乱码。
6)按王秀文的《超简单用Python让Excel飞起来》合并Excel多个工作簿的同名工作表,不仅失败且打开一大堆无用的窗口。
7)怎么能打开iris.xls却不能打不开从中国知网下载的xls的文件呢?将设置默认的打开程序从WPS改为Excel就发现了问题:
找到原因了!办法也就有了:用Excel将原文件另存为新的xls文件再用readxl打开就可以读了,不需要预装Perl因为将Perl卸载重启系统也证明可以打开。如将xls另存为xslx文件也可以且操作更简单。
总结:用R读xls文件本来就非常很难,加上有人不想你大量下载数据故意挖了坑,因而出现了很难发现的错误。但如认真总结经,采取顺藤摸瓜、跟踪追击的方法,找到最底层的错误,也可以解决难题。