按内容截取行中的某字段(列)

1.按分隔符截取
 例如,截取有固定格式的日志
#cat myfile
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111

#cat myfile | awk -F' ClientLog---> ' '{print $2}'|awk -F',' '{print $1":"$3}'|awk -F':' '{print $2 $4}'
123212342,3837482931
123212342,3837482931
123212342,3837482931


2.按内容截取
例如,要截取myfile日志中uuid内容和PUB_ID内容,字段长度固定,位置不确定:
# cat myfile
 2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,phone:372901111,PUB_ID:3837482931,
2012-01-12 23:00:00 org.umessage.subway.ClientLog--->uuid:123212342,pid:ewldkjf,PUB_ID:3837482931,phone:372901111

# cat  myfile  |  sed 's/ .*uuid:\(.........\).*PUB_ID:\(..........\).*/\1 ,\2/'

123212342,3837482931
123212342,3837482931
123212342,3837482931
123212342,3837482931
123212342,3837482931

sed命令解释:意思是所有把匹配 .*uuid:\(.........\).*PUB_ID:\(..........\).*的行替换成被匹配到的括号中的内容输出;
其中各选项参数以/分割,s表示替换,\1表示前面将被替换的正则表达式中第一个括号里的内容,\n表示第n组的内容,  .表示匹配任意一个字符,*表示前面项匹配任意次

参考:http://www.iteye.com/topic/587673
           http://wenku.baidu.com/view/bd0c155e312b3169a451a4de.html
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值