utf-8 gbk


字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。

GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
UTF-8GBK是两种不同的字符编码方式,UTF-8是一种变长编码,而GBK是一种固定长度编码。在C语言中,可以通过使用相关库函数来实现UTF-8GBK的转换。 首先,要将UTF-8编码的字符转换为GBK编码的字符,可以使用iconv函数。iconv函数是一个在C语言中进行字符集转换的库函数,它可以将一个字符由一种编码方式转换为另一种编码方式。首先,需要先使用iconv_open函数来打开一个转换句柄,将源字符串的编码方式指定为UTF-8,目标字符串的编码方式指定为GBK。然后,使用iconv函数将源字符串转换为目标字符串。 示例代码如下: ```c #include <iconv.h> #include <stdio.h> #include <stdlib.h> #include <string.h> int main() { char *source = "UTF-8编码的字符串"; char *target = malloc(sizeof(char) * (strlen(source) + 1)); // 打开转换句柄 iconv_t conv = iconv_open("GBK", "UTF-8"); if (conv == (iconv_t)(-1)) { perror("转换句柄打开失败"); exit(1); } // 进行转换 size_t inBytes = strlen(source); size_t outBytes = strlen(source) + 1; size_t ret = iconv(conv, &source, &inBytes, &target, &outBytes); if (ret == (size_t)(-1)) { perror("转换失败"); exit(1); } // 关闭转换句柄 iconv_close(conv); printf("GBK编码的字符串:%s\n", target); free(target); return 0; } ``` 同样地,要将GBK编码的字符转换为UTF-8编码的字符,只需要将上述示例代码中的源编码和目标编码对调即可。 以上就是在C语言中如何进行UTF-8GBK编码的转换的简要说明。通过使用iconv函数,我们可以在C语言中轻松实现这两种编码方式之间的转换。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值