匹配不包含指定中文字符的行

原创 2015年07月09日 21:45:26

上一篇利用正则表达式匹配不包含某些指定字符的只是动动脑机,回忆一下正则表达式, 但是遇到了中文,一来编码问题不方便, 二来容易考虑问题有漏洞。 如果我们想实现匹配不包含某些字符串的功能, 还是用shell脚本比较安全。

如下面这段代码实现匹配所有不含“登录”和“注册”的行。其中, “=~”表示包含。

str="登录|注册"

while read line; do
    if  [[ ! $line =~ $str ]]; then
        echo $line;
    fi
done < inputfile

正则表达式匹配不包含某些字符串的技巧

经常我们会遇到想找出不包含某个字符串的文本,程序员最容易想到的是在正则表达式里使用,^(hede)来过滤”hede”字串,但这种写法是错误的。我们可以这样写:[^hede],但这样的正则表达式完全是另...
  • MYsce
  • MYsce
  • 2017年08月01日 17:08
  • 1348

正则表达式里字符串”不包含”匹配技巧

经常我们会遇到想找出不包含某个字符串的文本,程序员最容易想到的是在正则表达式里使用,^(hede)来过滤”hede”字串,但这种写法是错误的。我们可以这样写:[^hede],但这样的正则表达式完全是另...
  • rainbow702
  • rainbow702
  • 2016年01月14日 16:52
  • 5326

如何使用 awk 和正则表达式过滤文本或文件中的字符串

当我们在 Unix/Linux 下使用特定的命令从字符串或文件中读取或编辑文本时,我们经常需要过滤输出以得到感兴趣的部分。这时正则表达式就派上用场了。 什么是正则表达式? 正则表达式可以定...
  • hello_katty
  • hello_katty
  • 2016年07月19日 10:48
  • 16891

正则表达式 - 中文字符的匹配

GBK、GB2312和BIG5,日文字符集的各种字、标点以及特殊符号的匹配
  • ZacksEdge
  • ZacksEdge
  • 2015年06月15日 15:22
  • 499

匹配中文字符的正则表达式: [/u4e00-/u9fa5]

匹配双字节字符(包括汉字在内):[^x00-xff]   评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)   匹配空白行的正则表达式:ns*r   评注:可以用来删除空白...
  • yigelangmandeshiren
  • yigelangmandeshiren
  • 2011年05月12日 14:02
  • 16470

匹配中文字符的正则表达式

这里是几个主要非英文语系字符范围(google上找到的): 2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字...
  • ll641058431
  • ll641058431
  • 2016年12月01日 15:30
  • 519

匹配中文字符的正则表达式: [/u4e00-/u9fa5]

原文:http://blog.sunmast.com/Sunmast/archive/2004/07/30/799.aspx 这里是几个主要非英文语系字符范围(google上找到的): 2...
  • shang1219178163
  • shang1219178163
  • 2015年09月11日 09:59
  • 333

plsql中文字符不能匹配

plsql不能进行中文字符匹配,条件查询不能使用中文字符
  • zoujian1993
  • zoujian1993
  • 2016年01月26日 21:54
  • 572

匹配中文字符的正则表达式: [/u4e00-/u9fa5]

这里是几个主要非英文语系字符范围(google上找到的): 2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字...
  • ye1992
  • ye1992
  • 2014年05月08日 10:45
  • 25400

匹配中文字符的正则表达式

From: http://blog.sina.com.cn/s/blog_4540c3630100aq01.html 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字...
  • qinglu000
  • qinglu000
  • 2016年10月21日 14:20
  • 334
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:匹配不包含指定中文字符的行
举报原因:
原因补充:

(最多只允许输入30个字)