c语言默认汉字编码,【C语言学习】C语言汉字编码。。。C语言中汉字的输入

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

以下是我本人通过实例得出的结论,没有参照任何参考书。可能有不对的地方。

哪里不对,情各位大虾指正。

在说明之前,本人编写了一个小代码。

#include

#include

int main()

{

char a[10];

strcpy(a,"你好吗");

for(int i=0;i<10;i++)

printf("%X  ",(unsigned char)a[i]);

printf("\n");

puts(a);

printf("\n");

return 0;

}

大家可以调试运行一下。

输出结果是。

C4  E3  BA  C3  C2  F0  0  CC  CC  CC

你好吗

Press any key to continue

字符串a中存放了3个汉字,每个char是占用一个字节。

在C语言中汉字采用的是gb2312编码,每个汉字占两个字节。

printf("%X  ",(unsigned char)a[i]);

输出了每个char地址存放的数据的16进制码。

两个char地址存放一个汉字。

所以

你=====C4  E3

好=====BA  C3

吗=====C2  F0

最后由于是一个字符串。在该字符串的结尾又另外存放了一个\0,表示字符串结束。

程序开头声明了char a[10];十个字符空间。

对于没有存放数据的3个char空间默认存放了CC。

a[0]表示的是“你”的gb2312编码的高八位

a[1]表示的是“你”的gb2312编码的低八位

a[2]表示的是“好”的gb2312编码的高八位

a[3]表示的是“好”的gb2312编码的低八位

a[4]表示的是“吗”的gb2312编码的高八位

a[5]表示的是“吗”的gb2312编码的低八位

a[0]表示的是“\0”的gb2312编码的ASCCII编码

其实gb2312兼容是ASCII编码。对于英文字符和中文字符同时具有的字符串。

请看下面这个例子。

#include

#include

int main()

{

char a[20];

strcpy(a,"你好吗mylove");

for(int i=0;i<20;i++)

printf("%X  ",(unsigned char)a[i]);

printf("\n");

puts(a);

printf("\n");

return 0;

}

输出结果

C4  E3  BA  C3  C2  F0  6D  79  6C  6F  76  65  0  CC  CC  CC  CC  CC  CC  CC

你好吗mylove

从输出结果中我们可以看出总共使用了13个字节。

其中“你好吗”占用6个字节

“mylove”占用6个字节。

字符串结束符占用1个字节。。

这样大家对C语言中汉字的存储是不是很清晰的了解了呢?

下面看C语言中汉字的输入。

在头文件#include

中的gets()可以实现汉字的输入。同样是gb2312码的输入。gb2312兼容了ASCII编码。

好了,就写这些了。我的QQ号 791808990

换用大家来交流。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值