计算机相关知识之字符编码集

计算机里的文件、数据、图片等文件对于我们人来说都只是表面现象,其所有文件在底层都是二进制文件,即全部都是字节码。
对于文本文件而言,之所以我们可以看到一个一个的字符,这完全是因为各个操作系统都会将底层的字节序列转换成字符序列的缘故。
这个转换过程:计算机<-->人中间产生两个概念,就是编码(Encode)和解码(Decode),即然要进行编码与解码,那么就必须要遵守一定的规范.对于文本文件而言,就必须要有相关字符集的支持。
[color=blue][size=medium]常见的字符集如下:[/size][/color]
[color=darkblue]1:ASCII:[/color]美国信息互换标准代码[单字节]
[color=darkblue]2:GB2312:[/color]中华人民共和国国家汉字信息交换用汉字编码集,也就是"国标码"GB
[color=darkblue]3:GBK:[/color]对GB2312的扩展,也就是国标扩展码,包括了一些不常用的字,符号等.
[color=darkblue]4:ISO-8859-1:[/color]是西方国家所使用的字符编码,是一种单字节的字符集,英文只用了其中数字小于128的部分
[color=darkblue]5:Unicode:[/color]是一种通用的字符集,对所有语言的文字进行了统一编码,对每一个字符都用了2个字节,所以传输英文网页的时候效率不高
[color=darkblue]6:UTF-8:[/color]能够用于全世界的字符,是一种不等长的编码,对于中文是用三个字节,对于英文只用一个字节,所以这个编码用的最广泛

Windows系统默认使用字符集:GBK
Ubuntu系统默认使用字符集:UTF-8
java使用Unicode表示字符串和字符,Unicode使用两个字节来表示一个字符.即一个字符占16位
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值