awk匹配输出正则部分

(1)hadoop fs -ls hdfs://zhihu-tc:8020/user/hive/warehouse/ad_trigger.db/*??/|awk '{match($NF,/.*([0-9]{8}).*/,a); print $0}'

(2)awk提取"keyword":[和,"time""之间的特征串

cat target.20180627.16 |awk -F"\t" '{match($2,/"keyword":\[(.*?),"time"/,a); gsub("]", "", a[1]); if(a[1] != "") print $1"\t"a[1]}'

注意:awk的match的贪婪匹配

(3)awk判断字符串仅含有中文和数字的方法:

echo ""杭州婚博会 2017""|awk '{gsub("[^\\u4e00-\\u9fa5]+|[0-9a-zA-Z]+","",$0); print $0 == ""}' 替换完如果为空就是仅含有中文和数字、字母的


https://blog.csdn.net/choumin/article/details/71023199

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值