汉字统计（2030）

最新推荐文章于 2019-03-07 13:08:14 发布

下定决心做一件事

最新推荐文章于 2019-03-07 13:08:14 发布

阅读量603

点赞数

分类专栏： acm基础

本文链接：https://blog.csdn.net/dqsyguoguo/article/details/38734305

版权

acm基础专栏收录该内容

67 篇文章 1 订阅

订阅专栏

汉字统计

Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 23842 Accepted Submission(s): 13010

Problem Description

统计给定文本文件中汉字的个数。

Input

输入文件首先包含一个整数n，表示测试实例的个数，然后是n段文本。

Output

对于每一段文本，输出其中的汉字的个数，每个测试实例的输出占一行。

[Hint:]从汉字机内码的特点考虑~

Sample Input

  
  
   
   2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?

Sample Output

  
  
   
   14
9
  
  
  
  

  
  
  
  
   
   -------------------------------------------------
  
  
  
  
   
   注意：
  
  
  
  

  
  
  
  
   
   汉字机内码在计算机的表达方式的描述是，使用二个字节，每个字节最高位一位为1。 
计算机中， 补码第一位是符号位， 1 表示为 负数， 
所以 汉字机内码的每个字节表示的十进制数都是负数
统计输入字符串含有几个汉字，只只需求出字符串中小于0的字符有几个，将它除以2就得到答案
   
   

  
  
  
  
   
   

  
  
  
  
   
   

  
  
  
  
   
   #include<stdio.h>
   
   
#include<string.h>
   
   
int main()
   
   
{
   
   

   
   	char s[10000];
   
   

   
   	int n,i;
   
   

   
   	while(scanf("%d",&n)!=EOF)
   
   

   
   	{
   
   

   
   		getchar();
   
   

   
   		while(n--)
   
   

   
   		{
   
   

   
   		
   
   	gets(s);
   
   

   
   		                   //scanf("%s",s);  在这别用scanf,因为scanf遇到空格即停止
   
   

   
   			int count=0;
   
   

   
   			for(i=0;i<strlen(s);i++)
   
   

   
   			{
   
   

   
   				if(s[i]<0) count++;
   
   

   
   			}
   
   

   
   			printf("%d\n",count/2);
   
   

   
   		}
   
   

   
   

   
   

   
   	}
   
   

   
   	return 0;
   
   
}
   
   

  
  
  
  
   
   

  
  
  
  
   
   

  
  
  
  
   
   

  
  
  
  
   
   

  
  
  
  
   
   F：2
  
  
  
  
   
   

  
  
  
  
   
   

  
  
  
  
   
   #include"stdio.h"
   
   
#include"string.h"
   
   
int main()
   
   
{
   
   

   
   	char s[1000];
   
   

   
   	int i,j,n,m;
   
   

   
   	scanf("%d\n",&n);
   
   

   
   	while(n--)
   
   

   
   	{
   
   

   
   		m=0;
   
   

   
   		gets(s);
   
   

   
   		j=strlen(s);
   
   

   
   		for(i=0;i<j;i++)
   
   

   
   		{
   
   

   
   			if((s[i]<32)||(s[i]>126))
   
   

   
   				m++;
   
   

   
   

   
   

   
   		}
   
   

   
   		printf("%d\n",(m+1)/2);
   
   

   
   

   
   

   
   	}
   
   

   
   	return 0;
   
   
}
   
   

  
  
  
  
   
   

  
  
  
  
   
   

  
  
  
  
   
   -------------------------------------------------------------------------------------
   
   
   
   汉字机内码

   
       
    
     
     
      
      
       
       
        
        汉字机内码，又称“汉字ASCII码”，简称“内码”，指计算机内部存储，处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字
        
        操作系统的“输入码转换模块”转换为机内码，与所采用的键盘
        
        输入法无关。机内码是汉字最基本的编码，不管是什么汉字
        
        系统和
        
        汉字输入方法，输入的汉字外码到机器内部都要转换成机内码，才能被
        
        存储和进行各种处理。
       
       
      
      
     
     
    
    
    
    
     
     目录
     
     
      
      
       
       1具体解释
      
      
     
     
     
     
    
    
    
    
    
    
     
     
      
      
      
      
      
      
     
     
     
     1具体解释编辑
     
     
      
      汉字在计算机内部其内码是唯一的。因为汉字处理
      
      系统要保证中西文的兼容，当系统中同时存在
      
      ASCII码和汉字
      
      国标码时，将会产生二义性。例如：有两个字节的内容为30H和21H，它既可表示汉字“啊”的
      
      国标码，又可表示西文“0”和“!”的ASCII码。为此，汉字机内码应对
      
      国标码加以适当处理和变换。
     
     
     
     
      
      国标码的机内码为二
      
      字节长的代码，它是在相应
      
      国标码的每个字节最高位上加“1”，即
     
     
     
     
      
      汉字机内码=
      
      汉字国标码+A0A0H
     
     
     
     
      
      例如，上述“啊”字的
      
      国标码是3021H，其汉字机内码则是B0A1H。
     
     
     
     
      
      汉字机内码的基础是
      
      汉字国标码。
     
     
     
     
      
      机内码：为了避免ASCII码和
      
      国标码同时使用时产生二义性问题，大部分汉字
      
      系统都采用将国标码每个
      
      字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性，又使汉字机内码与
      
      国标码具有极简单的对应关系。
     
     
     
     
      
      汉字机内码、
      
      国标码和
      
      区位码三者之间的关系为：区位码（十进制）的两个字节分别转换为十六进制后加2020H得到对应的国标码；机内码是汉字交换码（国标码）两个字节的最高位分别加1，即汉字交换码（国标码）的两个字节分别加80H得到对应的机内码；区位码（十进制）的两个字节分别转换为十六进制后加A0H得到对应的机内码。
     
     
     
     
      
      举例：机内码位BEDF，求
      
      区位码？
     
     
     
     
      
      有两种解法：1.BEDFH-A0A0H=1E3FH=3063D；
     
     
     
     
      
      2.BEDFH-8080H=3E5FH(
      
      国标码),3E5FH-2020H=1E3FH=3063D.