Problem Description
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
[Hint:]从汉字机内码的特点考虑~
Sample Input
2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready?
Sample Output
14
9
源代码:
#include<stdio.h>
#include<string.h>
int main()
{
int n,i,k;
char a[1000];
scanf("%d",&n);
getchar();
while(n--)
{
gets(a);
k=0;
for(i=0;i<strlen(a)-1;i++)
if(a[i]<0)
k++;
printf("%d\n",k/2);
}
return 0;
}
汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1。
计算机中, 补码第一位是符号位, 1 表示为 负数,
所以 汉字机内码的每个字节表示的十进制数都是负数
统计输入字符串含有几个汉字,只只需求出字符串中小于0的字符有几个,将它除以2就得到答案
在linux下用的是unicode,每个汉字是三个字节,在windows下常用gb2312,每个汉字两个字节。这道题目是两个字节