汉字统计
Problem Description
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
[Hint:]从汉字机内码的特点考虑~
Sample Input
2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready?
Sample Output
14 9
这道题只要知道一个汉字在字符串中是以两个负的字符形式存储,然后遍历即可。
代码实现:
<span style="font-family:Times New Roman;font-size:14px;">import java.util.Scanner;
public class Main {
//统计给定文本文件中汉字的个数。
public static void main(String[] args) {
Scanner sc=new Scanner(System.in);
int n=sc.nextInt();
sc.nextLine();
while(n-->0){
// 一个汉字在字符串中是以两个负的字符形式存储,所以本题只要把字符串中负字符的个数找出来,再除以2 就OK了。
// 汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1。
// 计算机中, 补码第一位是符号位, 1 表示为 负数, 所以 汉字机内码的每个字节表示的十进制数都是负数
String str=sc.nextLine();
int sum=0;
byte b[]=str.getBytes();
for(int i=0;i<b.length;i++){
if(b[i]<0){
sum++;
}
}
System.out.println(sum/2);
}
}
}
</span>