汉字统计

最新推荐文章于 2024-09-23 14:27:27 发布

稚皓君

最新推荐文章于 2024-09-23 14:27:27 发布

阅读量248

点赞数 1

分类专栏： # hdu（杭电）文章标签：算法

本文链接：https://blog.csdn.net/m0_46669450/article/details/107731070

版权

hdu（杭电）专栏收录该内容

13 篇文章 0 订阅

订阅专栏

传送门

2030 汉字统计

Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 77610 Accepted Submission(s): 41662

Problem Description
统计给定文本文件中汉字的个数。

Input
输入文件首先包含一个整数n，表示测试实例的个数，然后是n段文本。

Output
对于每一段文本，输出其中的汉字的个数，每个测试实例的输出占一行。
[Hint:]从汉字机内码的特点考虑~

Sample Input
2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?

Sample Output
14
9

汉字内码(机内码)
(1)概念：在计算机内部表示汉字的代码。
(2)特点：汉字内码采用两个字节，一个汉字占两个ASCII字符；汉字内码最高位为1，ASCII码最高位为0
(3)汉字内码与区位码的关系：
汉字内码高位字节=(区号)16+(A0)16
汉字内码低位字节=(位号)16+(A0)16
例：汉字“啊”的区位码为1601，则其汉字内码为(B0A1)16。

所以，每个汉字都是小于0的。非汉字都是大于0的。而每个汉字占用两个字节，最后sum要除以二。

代码

#include<stdio.h>
#include<string.h>
int main()
{
    int n,i,sum,h,len;
    char a[200];
    scanf("%d",&n);
    getchar();
    while(n--)
    {
        gets(a);
        sum=0;
         len=strlen(a);
        for(i=0;i<len;i++)
        {
            if(a[i]<0)
            {
                sum++;
            }
        }
        printf("%d\n",sum/2);
    }
    return 0;
}