正则表达式及JAVA复杂文本操作

本文介绍了正则表达式的基本知识,包括其定义、优势、用途、语法规则和开发流程等,如普通字符、转义字符、标准字符集合等。还给出了正则表达式的测试示例,如电话号码、邮箱地址匹配等。此外,讲解了Java中利用java.util.regex包进行复杂文本操作的相关类。

正则表达式及Java复杂文本操作

一、正则表示的基本知识

正则表达式,又称规则表达式**。**(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

  • 为什么需要正则
    • 文本的复杂处理
  • 正则表达式的优势和用途
    • 一种强大的而灵活的文本处理工具;
    • 大部分编程语言、数据库、文本编辑器、开发环境都支持正则表达式;
  • 正则表达式的定义
    • 正如它的名字一样描述了一个规则,通过这个规则可以匹配一类字符串;
    • 学习正则表达式很大程度上就是学习它的语法规则;
  • 开发中使用正则表达式的流程
    • 分析所要匹配的数据,写出测试用的典型数据;
    • 在工具软件中进行匹配测试;
    • 在程序调用通过测试的正则表达式;
  1. 基本语法

    普通字符

    • 字母、数字、汉字、下划线、以及没有特殊定义的标点符号、都是普通字符。表达式中的普通字符,在匹配一个字符串的时候、匹配与之相同的一个字符。

    简单的转义字符

    \n 代表换行符
    \t 制表符
    \\ 代表\本身
    \^ ,\$ ,\. ,\{ ,\} ,\? ,\+ ,\* ,\ ,\[ ,\]

    标准字符集合

    • 能够与多中字符匹配表达式
    • 注意区分大小写,大写是相反的意思
    \d 任意一个数字,0~9中的任意一个
    \w 任意一个字符或数字或下划线,也就是A~Z, a~z, 0~9 ,_ 中任意一个
    \s 包括空格、制表符、换行符、等空白字符的其中任意一个
    . 小数点可以匹配任意一个字符(换行符除外),如果要匹配包括“\n”在内的所有字符,一般用[\s\S]

    自定义字符集合

    • [ ]方括号匹配方式,能够匹配方括号中任意一个字符
    [ab5@] 匹配“a”或“b”或“5”或“@”
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值