//C语言//杭电OJ2030//答案备份//可优化

桦林子

已于 2024-02-07 21:32:01 修改

阅读量480

点赞数 7

文章标签：算法

于 2024-02-07 17:35:15 首次发布

本文链接：https://blog.csdn.net/2301_79922937/article/details/136071765

版权

文章讲述了汉字机内码的编码机制，特别是区位码的概念，以及与ASCII码的对比。给出了一个C语言程序示例，原始版本通过逐字节检查存储汉字字符，优化版利用顺序表提高效率。

摘要由CSDN通过智能技术生成

Hint（提示）：“从汉字机内码的特点考虑”

联系：Unicode（统一码），使用区码、位码（即区位码）来为汉字字符编码，区位码相当于直角坐标系里的横纵坐标，每一个横纵坐标对应坐标中唯一的点，唯一的汉字。储存方面，区码占1个字节，位码也占1个字节，故一个汉字占用两个字节（十六位），每个字节最高位都是1（因为最高位为0的编码已经被ASII码用了）。

注意：在ASCII码中，使用一个字节（Byte）储存一个字符的编码，对应字符数组char[ ]的一个位置（char类型大小为一个字节对应8位8Bit）；在Unicode中，使用两个字节储存一个汉字字符的编码，对应字符数组的两个位置，第一个位置储存区码，后一个位置储存位码。

//简单版
#include <stdio.h>
#include <string.h>

int main(){
    int n;
    int i;
    int cot;
    int length;

    scanf("%d",&n);
    getchar();

    while (n--)
    {
        unsigned char str[1000];//使用unsiged是因为对于汉字，字节的最高位不是符号位
        gets(str);
        
        cot=0;
        length=strlen(str);
        for(i=0 ; i<length-1 ; i++)
        {
            if (161<=str[i] && str[i]<=254)
            {
                    cot++;
                    i++;
            }
        }
        
        printf("%d\n",cot);
    }

    return 0;
}

优化版：利用了顺序表

待更新

桦林子

关注

7
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
//C语言//杭电OJ2030//答案备份//可优化

联系：Unicode（统一码），使用区码、位码（即区位码）来为汉字字符编码，区位码相当于直角坐标系里的横纵坐标，每一个横纵坐标对应坐标中唯一的点，唯一的汉字。储存方面，区码占1个字节，位码也占1个字节，故一个汉字占用两个字节（十六位），每个字节最高位都是1（因为最高位为0的编码已经被ASII码用了）。注意：在ASCII码中，使用一个字节（Byte）储存一个字符的编码，对应字符数组char[ ]的一个位置（char类型大小为一个字节对应8位8Bit）；Hint（提示）：“从汉字机内码的特点考虑”
复制链接

扫一扫