UNICODE GBK UTF-8等文本编码(理解+实践)

1.对编码的个人理解
一类是ASCII码,学C语言时接触到的,只能编码基本字符;
另外就是ANSI编码和UNICODE编码,这两类是编码标准,他有多种实现(就像H264标准一样)。
对于ANSI编码标准,简体中文对其实现有GBKGB2312GB18030 等编码(就像AVC一样,是H264标准的一种实现),繁体中文,日文有其他编码实现.
对于UNICODE编码标准,是国际通用编码,具体实现有
UTF-16 UTF-16LE UTF-16BE UCS-2  UTF-8等。
win8ubututu编码名称对应关系如下

Windows(win8 enterprise x64 zh) notepad

linux(ubuntu14.04 x64 en) gedit

ANSI

GB2312 GB18030 GBK

Chinese simplified

UNICODE

UTF-16 UTF-16LE UCS-2

UNICODE


UNICODE big endian

UTF-16 UTF-16BE

UTF-8

UTF-8




2.ubuntu下对编码方式转换

使用gedit打开,另存为可以选择编码方式。


3.使用enca查看文本编码方式(不怎么好用)

sudo apt-get install enca

enca -L zh_CN filename

ref http://blog.csdn.net/jnbbwyth/article/details/6991425/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值