我的项目需要将分词后的结果过滤掉英文和数字,在网上搜了一下,提到用正则表达式匹配过滤,经过实验,现将相应代码贴出来供参考:
String str = "待识别字符串";
str.matches(".*[\\u4e00-\\u9faf].*")
这段代码是识别str变量中是否有中文,只要str中至少有一个汉字,matches函数就返回true,否则属于纯英文或数字,返回false。
我的项目需要将分词后的结果过滤掉英文和数字,在网上搜了一下,提到用正则表达式匹配过滤,经过实验,现将相应代码贴出来供参考:
String str = "待识别字符串";
str.matches(".*[\\u4e00-\\u9faf].*")
这段代码是识别str变量中是否有中文,只要str中至少有一个汉字,matches函数就返回true,否则属于纯英文或数字,返回false。