【grep】从html表格中快速定位某个数据

1 背景

在html中是一堆表格、图片、文字什么的,想从表格中提取关键词为“GJC”后对应的数字,怎么办呢?
在这里插入图片描述
逐个打开html文件,“ctrl+F”搜一下,然后复制粘贴?数量少可以的,数量多就不ok了。

2 参考知识

2.1 grep

grep命令中的-A参数

-A NUM,--after-context=NUM

列出符合搜索行之后的NUM行,使用示例如下:

$ grep -A 1 panda file

从文件 file 中搜索有 panda 字样的行,并同时显示该行的后 1 行。

2.2 HTML基础语言标签

<tr></tr>、<td></td>属于HTML语言标签,含义如下:

  • tr 标签 ,代表HTML表格中的一行,tr标签是成对出现的,以开始,以结束。
  • td 标签 , 代表HTML表格中的一个单元格,td标签是成对出现的,以开始,以结束。

3 解决方案

输出:当前所有文件夹下的所有html文件中,GJC所在行 及后面3行

grep GJC -A 3 */*.html

如果输出内容比较多,可以将终端中输出的所有内容复制粘贴到excel中,善用数据-分列/排序功能

在这里插入图片描述

分列中分隔符号-空格(连续分隔符号视为单个处理)
排序中可以看看根据哪个列来操作

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值