c语言默认汉字编码,【C语言学习】C语言汉字编码。。。C语言中汉字的输入

最新推荐文章于 2023-09-18 20:04:33 发布

A-ZJT坤

最新推荐文章于 2023-09-18 20:04:33 发布

阅读量342

点赞数

文章标签： c语言默认汉字编码

该楼层疑似违规已被系统折叠隐藏此楼查看此楼

以下是我本人通过实例得出的结论，没有参照任何参考书。可能有不对的地方。

哪里不对，情各位大虾指正。

在说明之前，本人编写了一个小代码。

#include

#include

int main()

{

char a[10];

strcpy(a,"你好吗");

for(int i=0;i<10;i++)

printf("%X ",(unsigned char)a[i]);

printf("\n");

puts(a);

printf("\n");

return 0;

}

大家可以调试运行一下。

输出结果是。

C4 E3 BA C3 C2 F0 0 CC CC CC

你好吗

Press any key to continue

字符串a中存放了3个汉字，每个char是占用一个字节。

在C语言中汉字采用的是gb2312编码，每个汉字占两个字节。

printf("%X ",(unsigned char)a[i]);

输出了每个char地址存放的数据的16进制码。

两个char地址存放一个汉字。

所以

你=====C4 E3

好=====BA C3

吗=====C2 F0

最后由于是一个字符串。在该字符串的结尾又另外存放了一个\0，表示字符串结束。

程序开头声明了char a[10];十个字符空间。

对于没有存放数据的3个char空间默认存放了CC。

a[0]表示的是“你”的gb2312编码的高八位

a[1]表示的是“你”的gb2312编码的低八位

a[2]表示的是“好”的gb2312编码的高八位

a[3]表示的是“好”的gb2312编码的低八位

a[4]表示的是“吗”的gb2312编码的高八位

a[5]表示的是“吗”的gb2312编码的低八位

a[0]表示的是“\0”的gb2312编码的ASCCII编码

其实gb2312兼容是ASCII编码。对于英文字符和中文字符同时具有的字符串。

请看下面这个例子。

#include

#include

int main()

{

char a[20];

strcpy(a,"你好吗mylove");

for(int i=0;i<20;i++)

printf("%X ",(unsigned char)a[i]);

printf("\n");

puts(a);

printf("\n");

return 0;

}

输出结果

C4 E3 BA C3 C2 F0 6D 79 6C 6F 76 65 0 CC CC CC CC CC CC CC

你好吗mylove

从输出结果中我们可以看出总共使用了13个字节。

其中“你好吗”占用6个字节

“mylove”占用6个字节。

字符串结束符占用1个字节。。

这样大家对C语言中汉字的存储是不是很清晰的了解了呢?

下面看C语言中汉字的输入。

在头文件#include

中的gets()可以实现汉字的输入。同样是gb2312码的输入。gb2312兼容了ASCII编码。

好了，就写这些了。我的QQ号 791808990

换用大家来交流。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
c语言默认汉字编码,【C语言学习】C语言汉字编码。。。C语言中汉字的输入

该楼层疑似违规已被系统折叠隐藏此楼查看此楼以下是我本人通过实例得出的结论，没有参照任何参考书。可能有不对的地方。哪里不对，情各位大虾指正。在说明之前，本人编写了一个小代码。#include#includeintmain(){chara[10];strcpy(a,"你好吗");for(inti=0;i<10;i++)printf("%X",(unsignedchar)a[i]);...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。