根据word标题结构转换为excel的方法

一、需求描述

有一份具有4级目录的word文档(《证券期货业网络安全等级保护基本要求》),需要依据标题结构转换成excel文档,方便筛选对比和录入mongodb数据库。文档结构如下:

 

目标格式如下:

 

二、处理过程(参考快速按标题层级把Word转Excel—附详细操作步骤 - 知乎

原知乎答案中的例子内容比较少,可以收送插入制表符,我这个文档有60多页,手动添加不现实,而且容易遗漏。

1、使用notepad++进行标题格式化

(1)将文档复制到notepad++中,将四级标题“1.1.1.1”替换为“\t\t\t\t”。这里用到了我之前用过的匹配IP地址的正则表达式:

((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})(\.((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})){3}

1.1.1.1 看起来就是个IP地址

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值