正则表达式在文本过滤中的使用

正则表达式在文本过滤中的使用

这个系列简单记录学习正则表达式的历程,结合在grep awk sed 中的使用,增强印象。

(二)初识grep awk sed

简单的认为,grep是对文本以‘行’为单位处理,awk是对文本中的行以‘域’为单位处理,sed直接以文本中的字符为单位处理。
比如,test.txt的内容:

Hi, I am Han Meimei.
My name is Li Lei.
Nice to meet you.
Nice to meet you, too.
I have a meeting.
Googbye.
see you again.
  1. 在命令行中显示所有内容:
    cat test.txt
  2. 筛选除包含‘meet’的行:
    cat test.txt | grep meet
    or:
    grep meet test.txt
    这样会输出三行(注意第三行):

    Nice to meet you.
    Nice to meet you, too.
    I have a meeting.

  3. 现在,假如只想输出每行的第一个单词:
    cat test.txt | awk '{print $1}'
    or
    awk '{print $1}' test.txt
    awk的作用是把文件的每一行,按分隔符(默认是空格或Tab)分成多个‘域’,然后可以对特定的域处理,比如‘see you’分开成两个域:$1是 see,$2是 you。另外$0代表所有的域。
    awk的一般格式awk [-F xx] '{patter +action} {...} {} ' filename 其中[]是可选的, -F指定分隔符, ’ ‘里的每个{}是一个动作,可以有一个或多个.

  4. 现在新的要求,把’you’ 换成 ’we‘ 并输出
    sed 's/you/we/' test.txt

好了,更具体的使用后续再介绍。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值