在java如何判断字符串有多少中文字?

最新推荐文章于 2023-02-09 17:35:31 发布

cnaning

最新推荐文章于 2023-02-09 17:35:31 发布

阅读量223

点赞数

分类专栏： java 文章标签： Java 正则表达式 UP D语言工作

本文链接：https://blog.csdn.net/cnaning/article/details/83357850

版权

java 专栏收录该内容

35 篇文章 0 订阅

订阅专栏

小弟我以前用c语言的,最近做个课题,用java.不知道有没有好的方法,用于判断一个字符串中中文数量?

--------------------------------------------------------------------------------
回复1：
UP!

回复2：
str.toCharArray()根据中文中的编码点逐个判断

回复3：
楼上的能不能说的更清楚点:)

回复4：
用正则表达式[u4e00-u9fa5]
public static void main(String[] args) {
int count=0;
String regEx = "[\u4e00-\u9fa5]";
//System.out.println(regEx);
String str = "中文fdas";
//System.out.println(str);
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
while (m.find()) {
for (int i = 0; i <= m.groupCount(); i++) {
count=count+1;
}
}
System.out.println("共有"+count+"个");
}

回复5：
楼上的方法好!
如果是判断连续的几个中文怎么改啊.谢谢啊.

回复6：
不知道有没有现成的，下面的方法可以参考一下。
public int numOfChineseChar(String sourStr) throws UnsupportedEncodingException{
int len = sourStr.length();
byte[] bytStr = sourStr.getBytes();
int intStr, count = 0;

for(int i = 0; i < bytStr.length; i++){
intStr = bytStr[i];
if(intStr < 0){//JAVA中中文字符是负的BYTE值。
count++;
i++; //中文字符是双字节。
}
}

return count;
}

回复7：
String regEx = "[\u4e00-\u9fa5]";
//System.out.println(regEx);
String str = "中文fda她jjs";
String tem= str.replaceAll(regEx,"aa");
System.out.println(""+(tem.length()-str.length()));
不好意思，修改一下楼上的程序.

回复8：
liugang9936033(开心就好) 您的方法有创意.
不知道有没有判断连续出现多少个中文的方法,
比如:"你好1233",连续出现2个中文.
而"你1233好",连续出现1个中文.
这个怎么办啊.有人帮帮我吗?
谢谢楼上所有的朋友!

回复9：
你把你个字符串的中的非中文的都过滤掉剩下的都是中文的然后就取个数或其他操作不就可以了吗

回复10：
public class Zw {
char a;
int count=0;
//public String str="";
public void SetStr(String str){
//this.str=str;
for(int i=0;i<str.length();i++){
a=str.charAt(i);
if((a!='a')&&(a!='b')&&(a!='c')&&(a!='d')
&&(a!='e')&&(a!='f')&&(a!='g')&&(a!='h')
&&(a!='i')&&(a!='j')&&(a!='k')&&(a!='l')
&&(a!='m')&&(a!='n')&&(a!='o')&&(a!='p')
&&(a!='q')&&(a!='r')&&(a!='s')&&(a!='t')
&&(a!='u')&&(a!='v')&&(a!='w')&&(a!='x')
&&(a!='y')&&(a!='z')&&(a!='1')&&(a!='2')
&&(a!='3')&&(a!='4')&&(a!='5')&&(a!='6')
&&(a!='7')&&(a!='8')&&(a!='9')&&(a!='0')
&&(a!=',')&&(a!='.')&&(a!='/')&&(a!=';')
&&(a!=' ')&&(a!='[')&&(a!=']')&&(a!='\')){
count++;
continue;
}

}
System.out.println("COUNT的值为："+count);
}

/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
Zw z= new Zw();
z.SetStr("zhongwen中文");

}

}
你可以通过字母,数字和特殊字符的编码进行判断,我那些都忘了,只好写成这样了,如果是大小写字母的话在String类中有不区分大小的方法哎好久不干这个了都忘光了

回复11：
可以，还是用上面的方法，计算出连续负数的byte只就可以了
然后将负数的byte值的个数除以2就可以得到。

回复12：
public static void main(String[] args) {
int count = 0;
String regEx = "[u4e00-u9fa5]+[^u4e00-u9fa5]";
String str = "ss中文文fdas文";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
String repStr = null;
while (m.find()) {
repStr = m.group();
}
String regEx1 = "[u4e00-u9fa5]";
Pattern p1 = Pattern.compile(regEx1);
Matcher m1 = p1.matcher(repStr);
while (m1.find()) {
count = count + 1;
}
System.out.println("连续出现" + count + "个中文");
}
虽然程序写得很垃圾，但是达到要求了。

回复13：
package com.biaoflying;

import java.util.regex.*;
import java.util.*;

public class CountNum{
private static String str = "中文语言fd何as最近几天dafds" +
"工作dfds效率不高fdsf番dfsfdsa啊";
private static Pattern p;
private static Matcher m;
//private static int count=0;

public static int getNum(String str){
int count=0;
String regEx = "[\u4e00-\u9fa5]";
p = Pattern.compile(regEx);
m = p.matcher(str);
while(m.find())count++;
return count;
}
public static int alonechar(String str){
int together=0;
Map map=charLinked(str);
Iterator iter=map.values().iterator();
while(iter.hasNext()){
together+=((Integer)iter.next()).intValue();
}
return getNum(str)-together;
}
public static Map charLinked(String str){
Map map=new HashMap();
String temp=null;
String regEx = "[\u4e00-\u9fa5][\u4e00-\u9fa5]+";
p = Pattern.compile(regEx);
m = p.matcher(str);
while(m.find()){
temp=m.group();
map.put(temp,new Integer(temp.getBytes().length/2));
}
return map;
}
public static void main(String[] args) {
System.out.println(getNum(str));
System.out.println(charLinked(str));
System.out.println(alonechar(str));
}
}

回复14：
17
{效率不高=4, 最近几天=4, 工作=2, 中文语言=4}
3

回复15：
String regEx = "[^u4e00-u9fa5]+";
String str = "中文f1d3a她jjs";
String[] tem= str.split(regEx);

下面是测试结果，剩下就是你自己处理了。
//String str = "ssss中文f1d3a她jjs"-----[, 中文, 她]
//String str = "中文f1d3a她jjs"-------[中文, 她]

回复16：
public static void main(String[] args)
{
String input = "中文语言fd何as最近几天dafds工作dfds效率不高fdsf番dfsfdsa啊";
String temp = null;
Pattern p = Pattern.compile("[u4E00-u9FA5]+");
Matcher m = p.matcher(input);
while (m.find())
{
temp = m.group(0);
System.out.println(temp + ":" + temp.length());
}
}

回复17：
= =路过看看

回复18：
好贴，学习

回复19：
小弟谢谢上面各位了！
可以封贴了：）

回复20：
mark

回复21：
最后应该从二进制buffer开始分析。

回复22：
编码不同，方法不一样。

回复23：
牛！

回复24：
来的够晚了我
哈哈
走了！！！！！！！！

回复25：
mark一下

回复26：
好是复杂啊

回复27：
up

回复28：
收了.

回复29：
路过，收藏。

回复30：
mark

回复31：不错