日志大概是这个样子的,想统计下有多少个title:
grep title -o crawl_bilibili_minivideo_info.log | uniq -c
- o 只显示匹配到的地方(为了看到统计的是什么字符)。
-c表示匹配到的行数(小写c,代表count的意思,是计数;大写C是显示行数,context意思)。
uniq表示不重复,我认为是去重。也就是统计到title出现的不重复的行数。
比如我想匹配一个正则规则下的所有字符出现次数:
grep "at *" -o crawl_bilibili_minivideo_info.log | sort | uniq -c | sort -rn