汉字统计
Problem Description
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
Sample Input
2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?
Sample Output
14
9
Source
C语言程序设计练习(五)
汉字内码(机内码)
(1)概念:在计算机内部表示汉字的代码,又称“汉字ASCII码”,简称“内码”。
(2)特点:汉字内码采用两个字节,一个汉字占两个ASCII字符;汉字内 码最高位为1,ASCII码最高位为0。
(3)作用:计算机内部存储,处理加工。
(4)汉字内码与区位码的关系:
汉字内码高位字节=(区号)16+(A0)16
汉字内码低位字节=(位号)16+(A0)16
例3:汉字“啊”的区位码为1601,则其汉字内码为(B0A1)16。
参考资料:https://zhidao.baidu.com/question/33312942.html
()16是表示括号中是16进制
代码如下:
#include <stdio.h>
#include <string.h>
int main()
{
char ch[1000];
int i,sum,n,length;
scanf("%d",&n);
getchar();
while(n--)
{
gets(ch);
length=strlen(ch);
sum=0;
for (i=0;i<length;i++)
{
if (ch[i]<0)
{
sum++;
}
}
printf("%d\n",sum/2);
}
return 0;
}
网上更好的代码:
#include <stdio.h>
int main ()
{
int i,n,sum;
char c;
scanf("%d",&n);
getchar();
while (n--)
{
sum =0 ;
while ( (c= getchar())!= '\n')
{
if (c < 0 )
sum++;
}
printf("%d\n",sum/2);
}
return 0;
}
总结:
1.关于while((c=getchar())!=’\n’)的理解:
char c;
while((c=getchar())!='\n')
{
putchar(c);
}
*简化理解之后的原理(工作方式)
char c;
do
{
c=getchar();
putchar(c);
}while(c!='\n');
过程:
当程序调用getchar时,程序就等着用户按键。用户输入的字符被存放在键盘缓冲区中。直到用户按回车为止。当用户键入回车之后,getchar才开始从stdin流中每次读入一个字符。(stdin是C中的标准输入流,它是缓冲输入方式。)
2.汉字机内码在计算机的表达方式的描述是:使用二个字节,每个字节最高位一位是1。
计算机中,补码第一位是符号位,1表示为负数,
所以 汉字内码的每个字节表示的十进制数都是负数。
统计输入字符串含有几个汉字,只需求出字符串中小于0的字符有几个,将它除以2就得到答案。
了解更多:
汉字的国标码和机内码是怎么回事?
C语言 获取汉字机内码、区位码、国际码(以后要用可以直接粘贴)