背景:在将数据集标签转换为coco格式时,json通常较大且只有一行,基于行的检索命令往往难以直接筛选出需要的目标信息,且耗时明显。
使用riggrep能较好的解决该问题。
-o
只打印匹配的信息,再配合正则规则https://docs.rs/regex/1.5.4/regex/#syntax能快速筛选出需要的信息。
-o, --only-matching
Print only the matched (non-empty) parts of a matching line, with each such part on a separate output line.
例子
此处以小文件举例
(base)
# sky @ DESKTOP-NJJGMD8 in /mnt/d/tmp [19:12:11]
$ cat 1.json
iywwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww:"category":{"cat":1},{"dog":2}
(base)
# sky @ DESKTOP-NJJGMD8 in /mnt/d/tmp [19:12:25]
$ rg -o 'category.*?,' -tjson
1.json
1:category":{"cat":1},