正则表达式及Java复杂文本操作
一、正则表示的基本知识
正则表达式,又称规则表达式**。**(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
-
为什么需要正则
- 文本的复杂处理
-
正则表达式的优势和用途
- 一种强大的而灵活的文本处理工具;
- 大部分编程语言、数据库、文本编辑器、开发环境都支持正则表达式;
-
正则表达式的定义
- 正如它的名字一样描述了一个规则,通过这个规则可以匹配一类字符串;
- 学习正则表达式很大程度上就是学习它的语法规则;
-
开发中使用正则表达式的流程
- 分析所要匹配的数据,写出测试用的典型数据;
- 在工具软件中进行匹配测试;
- 在程序调用通过测试的正则表达式;
-
基本语法
普通字符
- 字母、数字、汉字、下划线、以及没有特殊定义的标点符号、都是普通字符。表达式中的普通字符,在匹配一个字符串的时候、匹配与之相同的一个字符。
简单的转义字符
\n 代表换行符 \t 制表符 \\ 代表\本身 \^ ,\$ ,\. ,\{ ,\} ,\? ,\+ ,\* ,\ ,\[ ,\] 标准字符集合
- 能够与多中字符匹配表达式
- 注意区分大小写,大写是相反的意思
\d 任意一个数字,0~9中的任意一个 \w 任意一个字符或数字或下划线,也就是A~Z, a~z, 0~9 ,_ 中任意一个 \s 包括空格、制表符、换行符、等空白字符的其中任意一个 . 小数点可以匹配任意一个字符(换行符除外),如果要匹配包括“\n”在内的所有字符,一般用[\s\S] 自定义字符集合
- [ ]方括号匹配方式,能够匹配方括号中任意一个字符
[ab5@] 匹配“a”或“b”或“5”或“@”

本文介绍了正则表达式的基本知识,包括其定义、优势、用途、语法规则和开发流程等,如普通字符、转义字符、标准字符集合等。还给出了正则表达式的测试示例,如电话号码、邮箱地址匹配等。此外,讲解了Java中利用java.util.regex包进行复杂文本操作的相关类。
最低0.47元/天 解锁文章
178

被折叠的 条评论
为什么被折叠?



