r语言提取cvs数据_R语言提取Microsoft Word中的表格

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言数据高效处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书,《R语言数据高效处理指南》(黄天元)【简介_书评_在线阅读】 - 当当图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

R语言与微软主流软件的交互能够让精准的操纵走向批量化,之前介绍过openxlsx包(HopeR:R语言操纵Excel进行数据透视与批处理),这次介绍一个与Word的交互,就是docxtractr包,它能够对Word中的表格进行提取,提取的格式是一个列表。通过对这个列表的操作,能够获知一个doc/docx文件中的表格数量,提取表格中的内容。对于同一输出的word文档,这个方法能够实现智能化的批处理,非常高效。

d3cb214a244161d83e1edae24d7380c0.png

这里提供一个链接:

https://github.com/hrbrmstr/docxtractr​github.com

旗舰函数:

read_docx

docx_extract_tbl

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值