问题
有时,需要从一个无规律的文本行中获取目标字段
样例:
- 有如下文本
2018-7-4_17:55:32[info]"node":"total_memory":3729,"total_thread":716.
---new line---
"total_memory":6666,"total_thread":716.
目标:获取total_memory字段的值,即3729
可使用sed工具,具体如下:
echo '2018-7-4_17:55:32[info]"node":"total_memory":3729,"total_thread":716.
---new line---
"total_memory":6666,"total_thread":716.' | \
grep -E 'total_memory' | \
sed -r 's!.*("total_memory":[0-9]+),.*!\1!g'
# 输出:
"total_memory":3729
"total_memory":6666
#说明:
-r:代表使用增强的正则表达式
括号:选择目标字段,在后续用\1表示
引申
如果需要对字段进行排序,并输出最大值,可采用如下脚本:
echo XXX | \
grep -E 'total_memory' | \
sed -r 's!.*("total_memory":[0-9]+),.*!\1!g' | \
sort -t : -k2nr | \
sed -n '1,1p'
#输出:
"total_memory":6666
- 基本原理是:通过sort按指定列逆序排序,并通过sed选择输出第一行