汉字统计
题目描述
统计给定文本文件中汉字的个数
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
Sample Input
2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?
李哲是憨批?
Sample Output
14
9
5
解题思路
汉字机内码在计算机中使用两个字节,每个字节的最高位为1,计算机中,补码的第一位为符号位,第一位为1,转化为10进制为负数,第一位为0,转化为10进制为正数,所以求汉字个数只需将小于0的字符统计出来,将结果除以2即可
下面是C语言代码
#include <stdio.h>
#include <string.h> //字符串函数的头文件
int main(void)
{
int n, len;
char a[10005]; //数组开大,避免越界
scanf("%d\n", &n); //注意scanf中'\n'用于吸收换行符
while(n--)
{
int ans = 0;
gets(a);
len = strlen(a);//将字符串长度保存,避免在循环中反复调用strlen函数,降低效率
for(int i = 0; i < len; i++)
{
if(a[i] < 0) ans++; //汉字的ASCII码为负值
}
printf("%d\n", ans/2); //坑点 char字符型为一个字节,一个汉字为两个字节
}
return 0;
}