R语言导出xlxs_R语言 读取excel2007文件(xlsx)

本文讲述了如何处理大型xlsx文件,通过在R语言中解压xlsx为xml格式,然后利用XML库解析xml文件,尤其是sheet1.xml和sharedStrings.xml。文中详细解释了XML序言、命名空间以及解析过程,并给出了解析xml文件的代码示例,指出解析大型xlsx文件的时间成本较高。
摘要由CSDN通过智能技术生成

码了几天字,@Conda 终于让我码到了10000,还有10000字,停下来休息下,记录下昨晚熬夜奋战的结果。

受某个德国小朋友的委托,需要处理一个53M的xlsx文件。据这位小朋友介绍,如果直接用gdata包中的read.xls函数读取会很慢,据说是半年

。恰好我服务器上的gdata安装总是不成功,自然也不能正常加载和使用read.xls文件。仔细考虑和查询,发现xlsx文件实际上是压缩的xml文件。

对于这一点在Microsoft

Excel的英文维基百科写的还是比较清楚的(遇到问题一定要先去调查清楚,不要盲目的喊不知道)。这里附上Microsoft

Excel的wiki首页:http://en.wikipedia.org/wiki/Microsoft_Excel

从wiki的截图我们可以看到,Microsoft Excel

2007以前的版本都是用的二进制文件(以xls结尾)作为主要的excel文件。而Microsoft Excel

2007则采用的是Office Open XML文件作为主要文件格式。Office Open

XML是基于XML文件格式的XML扩展文件,这个文件格式增在Excel2002中首次引入。PS:我没有见过2002这个版本,这个版本比Excel2003还古老,那时候我还只会玩热血传奇。

所以综上考虑,我可以用XML格式的读取方式来读取xlsx文件了。

1、解压xlsx文件。

以下命令在bash shell中执行:

[con

回答: Python中处理xlsx文件可以使用openpyxl库进行读写操作。如果文件后缀是xlsx,可以使用openpyxl库进行读写操作。你可以使用openpyxl库的相关函数来读取和写入xlsx文件。具体的使用方法可以参考openpyxl的官方文档\[3\]。另外,如果你想使用pandas生成xlsx文件,可以使用pandas库的to_excel函数来实现\[2\]。 #### 引用[.reference_title] - *1* [python--xlsx文件的读写](https://blog.csdn.net/liuyingying0418/article/details/101066630)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [python生成excel文件的三种方式](https://blog.csdn.net/cainiao_python/article/details/131179392)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [【Python】使用Python操作XLSX数据表](https://blog.csdn.net/weixin_52058417/article/details/123266853)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值