汉字统计
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 23842 Accepted Submission(s): 13010
Problem Description
统计给定文本文件中汉字的个数。
Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。
Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~
[Hint:]从汉字机内码的特点考虑~
Sample Input
2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready?
Sample Output
14 9-------------------------------------------------注意:汉字机内码在计算机的表达方式的描述是,使用二个字节,每个字节最高位一位为1。 计算机中, 补码第一位是符号位, 1 表示为 负数, 所以 汉字机内码的每个字节表示的十进制数都是负数 统计输入字符串含有几个汉字,只只需求出字符串中小于0的字符有几个,将它除以2就得到答案
#include<stdio.h>
#include<string.h>
int main()
{
char s[10000];
int n,i;
while(scanf("%d",&n)!=EOF)
{
getchar();
while(n--)
{
gets(s);
//scanf("%s",s); 在这别用scanf,因为scanf遇到空格即停止
int count=0;
for(i=0;i<strlen(s);i++)
{
if(s[i]<0) count++;
}
printf("%d\n",count/2);
}
}
return 0;
}
F:2
#include"stdio.h"
#include"string.h"
int main()
{
char s[1000];
int i,j,n,m;
scanf("%d\n",&n);
while(n--)
{
m=0;
gets(s);
j=strlen(s);
for(i=0;i<j;i++)
{
if((s[i]<32)||(s[i]>126))
m++;
}
printf("%d\n",(m+1)/2);
}
return 0;
}
-------------------------------------------------------------------------------------汉字机内码目录
1具体解释编辑
汉字在计算机内部其内码是唯一的。因为汉字处理 系统要保证中西文的兼容,当系统中同时存在 ASCII码和汉字 国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的 国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对 国标码加以适当处理和变换。汉字机内码= 汉字国标码+A0A0H例如,上述“啊”字的 国标码是3021H,其汉字机内码则是B0A1H。汉字机内码的基础是 汉字国标码。机内码:为了避免ASCII码和 国标码同时使用时产生二义性问题,大部分汉字 系统都采用将国标码每个 字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与 国标码具有极简单的对应关系。汉字机内码、 国标码和 区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。举例:机内码位BEDF,求 区位码?有两种解法:1.BEDFH-A0A0H=1E3FH=3063D;2.BEDFH-8080H=3E5FH( 国标码),3E5FH-2020H=1E3FH=3063D.