匹配<meta />标签 中的符编码方式 charset 源码 java


/**
* 匹配<meta http-equiv='Content-Type' content='text/html; charset=GB18030'/>标签中的字符编码
* 的正则表达式
*/
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
* <p>
* Title: RegTest正则表达式测试类
* </p>
* <p>
* Description: 匹配<meta标签中的字符编码
* </p>
* <p>
* Copyright: Copyright (c) 2010
* </p>
* <p>
* Company:
* </p>
*
* @author <a href="hpjianhua@163.com">hpjianhua</a>
* @version 1.0
* @created 2010-10-04
*/
public class RegTest {

public static void main(String[] args) {
// 要匹配的字符串
String source = "<meta http-equiv='Content-Type' content='text/html; charset=GB18030'/>";
// 将上面要匹配的字符串转换成小写
source = source.toLowerCase();
// 匹配的字符串的正则表达式
String reg_charset = "<meta[^>]*?charset=([a-z|A-Z|0-9]*[\\-]*[0-9]*)[\\s|\\S]*";

Pattern p = Pattern.compile(reg_charset);
Matcher m = p.matcher(source);

while (m.find()) {
System.out.println(m.group(0));
System.out.println(m.group(1));
}

}
}

// outout:
// <meta http-equiv='content-type' content='text/html; charset=gb18030'/>
// gb18030
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值