R包readxl 的libxls读取错误解决方法
![40ab6ff44532e2850ace2c9843a9e9ae.png](https://i-blog.csdnimg.cn/blog_migrate/8c19939e90c79f60f5270d16393db431.png)
缘起:xls转化为xlsx
CCK8和MTT实验完成后,需要进行数据分析,自然而然想到用R批量处理。结果xls文件不能被readxl包打开。
read_xls('bad.xls')Error: filepath: bad.xls libxls error: Unable to open file
千辛万苦安装了各种读取xls的R包,一一失败,不能解决问题
笨且有效的办法
用wps或office打开xls,然后另存为xlsx即可。如果有二三十个文件要转换,很容易出错。一个小技巧是打开所有文件xls后,一个一个另存为xlsx。windows下要注意设置显示文件扩展名。
linux下正确的打开方式
linux下当然考虑用命令行转换。费了半天时间,终于在SO上看到一个回答,用ssconvert的命令成功将xls文件转化为xlsx格式
sudo pacman -S gnumericssconvert bad1.xls good1.xlsx
批量转化
ls *xls | xargs -i ssconvert {} {}.xlsx
不正确的打开方式
libreoffice转化后有问题,打开xlsx文件,发现3个sheet会变1个sheet 同时乱码
sudo pacman -S libreofficelibreoffice --convert-to xlsx bad.xls
soffice --headless --convert-to xls --outdir converted *xls
坏的xls格式文件
绝大部分xls文件都能被readxl包正确读取,现在遇到的xls文件都是检测仪器的软件Varioskan产生的。用excel软件呢能打开能读取,但是不能修改写入,比如不能求均值。也许是宏安全的问题。很是不方便。