字符集就是一套文字符号及其编码。常用的字符集有:
GBK 定长 双字节 不是国际标准,支持的系统不少
UTF-8 非定长 1-4字节广泛支持,MYSQL也使用UTF-8
当然了,字符集还有很多,以后再深入学习这部分内容。

①linux系统下的字符集由变量LANG控制。
 [root@gagarin ~]# echo $LANG
 zh_CN.GB18030

②export LANG="ZH_CN.GB18030"(临时变更字符集,重启后失效)

③在/etc/sysconfig/i18n文件中,行首添加:(配置永久生效)
 LANG="ZH_CN.GB18030"
 并把之前的字符集行注释“#”
 . /etc/sysconfig/i18n(使修改生效)

④echo 'export LANG="ZH_CN.GB18030"' >>/etc/profile(全局系统环境变量配置文件)
 source /etc/profile(生效)
 echo $LANG(查看结果)

⑤工作场景中使用的脚本,为避免中文乱码,有时候也会在脚本里更改字符集:
 #!/bin/sh
 export LANG="ZH_CN.GB18030"
 (脚本内容)

⑥SSH工具(SecureCRT)要与linux的字符集保持一致。
 在SecureCRT的“会话选项”对话框,“终端”→“外观”类里,“字符编码”中的选项要和linux保持一致。
 linux使用的字符集为“ZH_CN.GB18030”,SecureCRT的选项里设置为“默认”即可。

⑦服务端和客户端字符集对应,乱码就可以有效避免。
 中文字符集:ZN_CN.GB18030
 字符集变量:LANG
 字符集配置文件:/etc/sysconfig/i18n

⑧echo命令(单行文本的追加)
 source与.(修改后的变量生效)
 export命令(设置环境变量)


使用centos支持中文

安装中文语言包:

yum groupinstall chinese-support

修改字符编码配置,没有这个文件就创建它:

vim /etc/sysconfig/i18n

修改后内容如下:

LANG="zh_CN.UTF-8"
SUPPORTED="zh_CN:zh:en_US.UTF-8:en_US:en:zh_CN.GB18030"
SYSFONT="latarcyrheb-sun16"

i18n文件是用来设置系统语言,比如:zh_CN.UTF-8、zh_CN.GB18030、zh_TW.Big5、en_US.UTF-8等。

i18n中三个环境变量:
LANG变量,设置系统语言。
SUPPORTED变量决定系统支持的语言,即系统能够显示的语言。
SYSFONT变量表示系统字体。

最后重启服务器:reboot





linux下查看文件编码以及编码转换

在linux下有时候需要编辑、查看windows下的文件,这样会经常遇到文件编码转换的问题,在windows中默认的文件格式在linux下看起来就有可能是乱码了(由于linux下的编码一般是utf-8的),这就需要进行编码转换。

一、查看文件编码
    在打开文件的时候输入:set fileencoding
    即可显示文件编码格式。  

 

二、文件编码转换
    1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
        在打开的文件中输入:set fileencoding=utf-8

    2、使用iconv转换,iconv的命令格式如下:

        iconv -f encoding -t encoding inputfile
        比如将一个UTF-8 编码的文件转换成GBK编码
        iconv -f GBK -t UTF-8 file1 -o file2

 

三、文件名编码转换:

    从linux往windows 拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名   中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。
    在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK。

    1、先看一下你的系统上是否安装了convmv,如果没安装的话在终端输入下面的命令安装:
       sudo yum -y install convmv

    2、下面看一下convmv的具体用法:
       convmv -f 源编码 -t 新编码 [选项] 文件名
       常用参数:
        -r 递归处理子文件夹
        --notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
        --list 显示所有支持的编码
        --unescap 可以做一下转义,比如把%20变成空格
    比如我们有一个utf8编码的文件名,转换成GBK编码,命令如下:
    convmv -f UTF-8 -t GBK --notest utf8编码的文件名

    这样转换后"utf8编码的文件名"会被转换成GBK编码(只是文件名编码的转换,文件内容不会发生变化)



linux下vim中文乱码的解决方法

1、下载

可到http://www.vim.org/下载最新的7.3版本的vim源码。

 

2、安装

在编译之前,先要./configure --help查看一下配置选项,其中这个配置需要加进来:--enable-multibyte   

其作用是支持多字节编码,这一步应该是很重要。在配置好了以后,自然是make 、make install了

 

3、最后是vimrc的脚本配置了

编辑~/.vimrc文件,加上如下几行:

set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936
set termencoding=utf-8
set encoding=utf-8

即可搞定。