使用正则表达式提取字符串中的内容

package cn.com.songjy.test;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexTest {

	public static void main(String[] args) {
		String regex = "\\[{1}(.+)\\]{1}";
		String str = "短信中包含以下敏感字:[fuck,shit,bitch]并且号码中包含以下黑名单:张三-13701234567,李四-18701234567";
		System.out.print("敏感字如下:");
		System.out.println(getKeyWords(regex, str));
		System.out.print("黑名单号码如下:");
		System.out.println(getMobiles(str));
		System.out.println("字符替换:"+replaceStr("我喜欢红色"));
	}
	
	//提取 中括号中关键字
	public static String getKeyWords(String regex,String str){
		Pattern p = Pattern.compile(regex);
		Matcher m = p.matcher(str);
		if(m.find()){
			return m.group(1);
		}
		return null;
	}

	//提取字符串中的手机号码
	public static String getMobiles(String str) {
	    Pattern p = Pattern.compile("(\\+86|)?(\\d{11})");
	    Matcher m = p.matcher(str);
	    StringBuilder sb = new StringBuilder();
	    while (m.find()) {
	    	if(sb.length()>0)
	    		sb.append(",");
	    	sb.append(m.group(2));
	    }
	    /*
	    * 不加"()"也能将手机号码输出 添加"()"是为了筛选数据添加上去的,
	    * 第一对"()"是为了获取字符串"+86",代码是System.out.println(m.group(1));,
	    * 第二对"()"是获取11位纯数字电话号码, 本次的输出的手机号码中包含了"+86",如果只要11位数字号码,
	    * 可将代码改为System.out.println(m.group(2));
	    */
	    //System.out.println(m.groupCount());// 该行代码是输出有几对"()",即捕获组个数,本次输出结果是2,因为有两对"()"
	    return sb.toString();
	}
	
	//替换字符
	public static String replaceStr(String str){
		
		String regex = "红";
		Pattern p = Pattern.compile(regex);
		Matcher m = p.matcher(str);

		return m.replaceAll("绿");
	}
}

### 回答1: 可以使用正则表达式提取字符串的电话号码。例如,可以使用以下代码: ```python import re text = "我的电话号码是:123-456-789,你可以打电话给我。" phone_pattern = re.compile(r'\d{3}-\d{3}-\d{4}') phone_numbers = phone_pattern.findall(text) print(phone_numbers) ``` 输出结果为: ``` ['123-456-789'] ``` 其,`re.compile()`函数用于编译正则表达式,`r'\d{3}-\d{3}-\d{4}'`表示匹配三个数字、一个短横线、三个数字、一个短横线、四个数字的模式。`findall()`函数用于在文本查找所有匹配的模式,并返回一个列表。 ### 回答2: 在Python使用正则表达式提取字符串的电话号码可以使用re(Regular Expression,正则表达式)库。以下是几个步骤: 1.导入re库 ``` import re ``` 2.定义正则表达式 电话号码的格式可能不同,有可能是带区号的,有可能是带分机号的,也有可能是没有区号和分机号的。所以需要定义多个正则表达式来匹配不同格式的电话号码。 例如: 1)只有数字的电话号码(11位) ``` pattern1 = r'\d{11}' ``` 2)带区号的电话号码(可能有空格或“-”分隔符) ``` pattern2 = r'\d{3}\s*-\s*\d{8}|\d{4}\s*-\s*\d{7}' ``` 3)带分机号的电话号码 ``` pattern3 = r'\d{8,11}\s*-\s*\d{1,5}' ``` 3.使用re.match()函数匹配字符串 ``` text = '我的电话号码是:13811112222,工作电话是:010-88888888,手机是:13666666666,分机号是:8888。' match1 = re.match(pattern1, text) match2 = re.match(pattern2, text) match3 = re.match(pattern3, text) ``` 4.输出匹配结果 ``` if match1: print('匹配结果1:', match1.group()) if match2: print('匹配结果2:', match2.group()) if match3: print('匹配结果3:', match3.group()) ``` 完整代码如下: ``` import re pattern1 = r'\d{11}' pattern2 = r'\d{3}\s*-\s*\d{8}|\d{4}\s*-\s*\d{7}' pattern3 = r'\d{8,11}\s*-\s*\d{1,5}' text = '我的电话号码是:13811112222,工作电话是:010-88888888,手机是:13666666666,分机号是:8888。' match1 = re.match(pattern1, text) match2 = re.match(pattern2, text) match3 = re.match(pattern3, text) if match1: print('匹配结果1:', match1.group()) if match2: print('匹配结果2:', match2.group()) if match3: print('匹配结果3:', match3.group()) ``` 输出结果如下: ``` 匹配结果1:13811112222 匹配结果2:010-88888888 匹配结果3:13666666666 - 8888 ``` ### 回答3: 在Python使用正则表达式提取字符串的电话号码,需要先导入re模块,然后使用re.match、re.search、re.findall等函数来匹配字符串,并获取匹配到的部分。 首先定义一个字符串,假设为“我的电话号码是13888888888,你的电话号码是13999999999”,接下来使用正则表达式匹配该字符串的电话号码: ```python import re # 定义字符串 string = "我的电话号码是13888888888,你的电话号码是13999999999" # 正则表达式匹配电话号码 phone_numbers = re.findall(r'\d{11}', string) # 输出匹配到的电话号码 print("电话号码:", phone_numbers) ``` 如果字符串有多个电话号码,使用re.findall函数会将所有匹配到的电话号码存储在一个列表正则表达式r'\d{11}'表示匹配11个数字,如果需要匹配其他长度的电话号码,可以根据实际情况修改正则表达式的数量词。 除此之外,还可以使用其他正则表达式的语法,如\d+、\d{3,4}-\d{7,8}等来匹配不同格式的电话号码。需要根据实际情况来选择匹配规则。 总的来说,Python使用正则表达式提取字符串的电话号码,实现起来比较简单。需要熟悉正则表达式的语法及其基本用法,并结合实际情况来选择合适的匹配规则。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值