自我总结(十二)

汉字统计

Problem Description
统计给定文本文件中汉字的个数。

Input
输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。

Output
对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。

[Hint:]从汉字机内码的特点考虑~

Sample Input
2
WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa!
马上就要期末考试了Are you ready?

Sample Output
14
9

Source
C语言程序设计练习(五)

汉字内码(机内码)

(1)概念:在计算机内部表示汉字的代码,又称“汉字ASCII码”,简称“内码”。

(2)特点:汉字内码采用两个字节,一个汉字占两个ASCII字符;汉字内 码最高位为1,ASCII码最高位为0。

(3)作用:计算机内部存储,处理加工。

(4)汉字内码与区位码的关系:

汉字内码高位字节=(区号)16+(A0)16

汉字内码低位字节=(位号)16+(A0)16

例3:汉字“啊”的区位码为1601,则其汉字内码为(B0A1)16。

参考资料:https://zhidao.baidu.com/question/33312942.html

()16是表示括号中是16进制

代码如下:

#include <stdio.h>
#include <string.h>
int main()
{
    char ch[1000];
    int i,sum,n,length;
    scanf("%d",&n);
    getchar();
    while(n--)
    {
        gets(ch);
        length=strlen(ch);
        sum=0;
        for (i=0;i<length;i++)
        {
            if (ch[i]<0)
            {
                sum++;
            }
        }
        printf("%d\n",sum/2);
 
    }
    return 0;
}

网上更好的代码:

#include <stdio.h>
int main ()
{
    int i,n,sum;
    char c;
    scanf("%d",&n);
    getchar();
    while (n--)
    {
        sum =0 ;
        while ( (c= getchar())!= '\n')
        {
            if (c < 0 )
                sum++;
        }
        printf("%d\n",sum/2);
    }
 
    return 0;
}

总结:

1.关于while((c=getchar())!=’\n’)的理解:

char c;
while((c=getchar())!='\n')
	{
		putchar(c);
	}

*简化理解之后的原理(工作方式)

char c;
	do
	{
		c=getchar();
		putchar(c);
	}while(c!='\n');

过程:
当程序调用getchar时,程序就等着用户按键。用户输入的字符被存放在键盘缓冲区中。直到用户按回车为止。当用户键入回车之后,getchar才开始从stdin流中每次读入一个字符。(stdin是C中的标准输入流,它是缓冲输入方式。)

2.汉字机内码在计算机的表达方式的描述是:使用二个字节,每个字节最高位一位是1。

计算机中,补码第一位是符号位,1表示为负数,

所以 汉字内码的每个字节表示的十进制数都是负数。

统计输入字符串含有几个汉字,只需求出字符串中小于0的字符有几个,将它除以2就得到答案。

了解更多:
汉字的国标码和机内码是怎么回事?
C语言 获取汉字机内码、区位码、国际码(以后要用可以直接粘贴)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值