1.对编码的个人理解
一类是ASCII码,学C语言时接触到的,只能编码基本字符;
另外就是ANSI编码和UNICODE编码,这两类是编码标准,他有多种实现(就像H264标准一样)。
对于ANSI编码标准,简体中文对其实现有GBK, GB2312, GB18030 等编码(就像AVC一样,是H264标准的一种实现),繁体中文,日文有其他编码实现.
对于UNICODE编码标准,是国际通用编码,具体实现有 UTF-16 UTF-16LE UTF-16BE UCS-2 UTF-8等。
win8与ubututu编码名称对应关系如下
Windows(win8 enterprise x64 zh) notepad | linux(ubuntu14.04 x64 en) gedit | |
ANSI | GB2312 GB18030 GBK | Chinese simplified |
UNICODE | UTF-16 UTF-16LE UCS-2 | UNICODE
|
UNICODE big endian | UTF-16 UTF-16BE | |
UTF-8 | UTF-8 | |
|
|
|
2.ubuntu下对编码方式转换
使用gedit打开,另存为可以选择编码方式。
3.使用enca查看文本编码方式(不怎么好用)
sudo apt-get install enca
enca -L zh_CN filename