正则表达式及其在Java和Python中的相关操作

最新推荐文章于 2023-01-11 23:15:35 发布

恒友成

最新推荐文章于 2023-01-11 23:15:35 发布

阅读量329

点赞数

分类专栏： web开发文章标签： regex 正则表达式 java python

本文链接：https://blog.csdn.net/lx_ros/article/details/93932031

版权

web开发专栏收录该内容

18 篇文章 0 订阅

订阅专栏

1.PCRE表达式全集1

字符	描述
`\`	将下一个字符标记为一个特殊字符、或一个原义字符(有^$()*+?.[\{\|共计12个)或一个向后引用或一个八进制转义符
`^`	匹配输入字符串的开始位置
`$`	匹配输入字符串的结束位置
`*`	匹配前面的子表达式零次或无数次，`*`等价于{0,}
`+`	匹配前面的子表达式1次或多次，+等价于{1,}
`?`	匹配前面的子表达式0或1次
`{n}`	匹配前面的子表达式确定的n次
`{n,}`	n是一个非负整数。至少匹配n次
`{n,m}`	m和n均为非负整数，其中n<=m。最少匹配n次且最多匹配m次
`x\|y`	没有包围在()里，其范围是整个正则表达式,“z\|food”能匹配“z”或“food”
`[xyz]`	字符集合（character class）。匹配所包含的任意一个字符。特殊字符仅有反斜线\保持特殊含义，用于转义字符。其它特殊字符如星号、加号、各种括号等均作为普通字符。脱字符^如果出现在首位则表示负值字符集合；如果出现在字符串中间就仅作为普通字符。连字符 - 如果出现在字符串中间表示字符范围描述；如果如果出现在首位（或末尾）则仅作为普通字符。右方括号应转义出现，也可以作为首位字符出现。
`[^xyz]`	排除型字符集合，匹配未列出的任意字符。“[^abc]”可以匹配“plain”中的“plin”
`[a-z]`	“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符
`[^a-z]`	排除型的字符范围，匹配任何不在指定范围内的任意字符
`\b`	匹配一个单词边界，也就是指单词和空格间的位置。例如，“er\b”可以匹配“never”中的“er”，但不能匹配“verb”中的“er”。
`\B`	匹配非单词边界。“er\B”能匹配“verb”中的“er”，但不能匹配“never”中的“er”。
`\d`	匹配一个数字字符。等价于[0-9]。
`\D`	匹配一个非数字字符。等价于[^0-9]。
`\f`	匹配一个换页符。等价于\x0c和\cL
`\n`	匹配一个换行符。等价于\x0a和\cJ
`\r`	匹配一个回车符。等价于\x0d和\cM
`\s`	匹配任何空白字符，包括空格、制表符、换页符等等,等价于[ \f\n\r\t\v]
`\S`	匹配任何非空白字符。等价于[^ \f\n\r\t\v]
`\t`	匹配一个制表符。等价于\x09和\cI
`\w`	匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”
`\W`	匹配任何非单词字符。等价于“[^A-Za-z0-9_]”
`()`	用于分组、提取数据(\d{4})-(\d{2})-(\d{2})匹配"2017-06-12"结果为 [“2017-06-12”, “2017”, “06”, “12”]
`.`	匹配除“\r”“\n”之外的任何单个字符。

2.Java中正则表达式相关操作

Java中的一个简单示例，主要是Pattern和Matcher类的使用。示例参考2

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class helloworld {
	public static void main(String[] args) {
		String lineString="QT3000! OK?";
		String patternString = "(.*)(\\d+)(.*)";
		//(.*)除\r、\n之外的字符0-无数次,（\\d+）数字1次上，
		Pattern pattern = Pattern.compile(patternString);
		
		Matcher matcher = pattern.matcher(lineString);
		//.group(0)表示模式本身，不计入groupCount
		if(matcher.find()) {
			System.out.println(matcher.groupCount());//3
			System.out.println(matcher.group(0));//QT3000! OK?
			System.out.println(matcher.group(1));//QT300
			System.out.println(matcher.group(2));//0
			System.out.println(matcher.group(3));//! OK?
		}
		int count = 0;
		//输出原字符串中匹配开始位置和结束位置
		String rgxString="\\d+";
		Pattern rgxPattern = Pattern.compile(rgxString);
		Matcher rgxMatcher = rgxPattern.matcher(lineString);
		while(rgxMatcher.find()) {
			count++;
			System.out.println(count);//1
			System.out.println("start(): "+rgxMatcher.start());//start(): 2
         	System.out.println("end(): "+rgxMatcher.end());//end(): 6
		}
	}
}

3.Python 中的正则表达式相关操作

详细说明见3

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Fri Jun 28 23:28:43 2019
@author: lx
"""
import re
 
string="1 creates 2,2 creates 3,3 creates everything"

res1=re.findall(r'\d',string)
print(res1)#['1', '2', '2', '3', '3']

res2=re.split(r'\s',string)
print(res2)#['1', 'creates', '2,2', 'creates', '3,3', 'creates', 'everything']

res3=re.match(r"(\d+)(\s+)",string);
print(res3.groups())#('1', ' '),only the begin position
res3_1=re.match(r"(\d+)(\s+)","a1 creates 2,2 creates 3,3 creates everything")
if not res3_1:
    print("No match")

res4=re.search(r"(\d+)(\s+)","a1 creates 2,2 creates 3,3 creates everything",re.M|re.I)
print(res4.groups())#('1', ' ')#The whole string,but only once.

phone = "0731-959-559 # This is Phone Number"
# Delete Python-style comments
num = re.sub(r'#.*$', "", phone)
print "Phone Num : ", num #Phone Num :  0731-959-559 
# Remove anything other than digits
num = re.sub(r'\D', "", "139-2387-3674")    
print "Phone Num : ", num #Phone Num :  13923873674

pattern = re.compile(r'\d+') #create a Pattern object                    
m = pattern.match('one12twothree34four')        # only the begin pos ,none match
print m #none
m = pattern.search('one12twothree34four')
print m.group() #12

引用

1.https://zh.wikipedia.org/wiki/正则表达式

2.https://www.tutorialspoint.com/java/java_regular_expressions.htm

3.https://docs.python.org/2/howto/regex.html

恒友成

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式及其在Java和Python中的相关操作

1.PCRE表达式全集1字符描述\将下一个字符标记为一个特殊字符、或一个原义字符(有^$()*+?.[\{|共计12个)或一个向后引用或一个八进制转义符^匹配输入字符串的开始位置$匹配输入字符串的结束位置*匹配前面的子表达式零次或无数次，*等价于{0,}+匹配前面的子表达式1次或多次，+等价于{1,}?匹配前面的子表达式0或1次...
复制链接

扫一扫