日常笔记系列:java汉字判断

首先了解一下汉字的unicode编码表:

字符集字数Unicode 编码
基本汉字20902字4E00-9FA5
基本汉字补充38字9FA6-9FCB
扩展A6582字3400-4DB5
扩展B42711字20000-2A6D6
扩展C4149字2A700-2B734
扩展D222字2B740-2B81D
康熙部首214字2F00-2FD5
部首扩展115字2E80-2EF3
兼容汉字477字F900-FAD9
兼容扩展542字2F800-2FA1D
PUA(GBK)部件81字E815-E86F
部件扩展452字E400-E5E8
PUA增补207字E600-E6CF
汉字笔画36字31C0-31E3
汉字结构12字2FF0-2FFB
汉语注音22字3105-3120
注音扩展22字31A0-31BA
1字3007

一般在使用时候,基本汉字就够了,也就是2万的那个,如果需要对汉字进行判断,就需要正则判断一下就可以。如果要求比较严格,可以对regEx部分的Unicode的范围进行合理的扩大就可以实现更大范围的判断。

import java.util.regex.Matcher;
import java.util.regex.Pattern;
	public static boolean isChinese(String str) {
		String regEx = "[\u4e00-\u9fa5]";
		Pattern pat = Pattern.compile(regEx);
		Matcher matcher = pat.matcher(str);
		boolean flg = false;
		if (matcher.find())
			flg = true;
			return flg;
	}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值