encoding=utf-8:不管文件的编码如何,不管如何显示和输入,Vim
内部使用的编码是 UTF-8;这是国际化支持的基础。
termencoding: 取决于实际的终端或 X Window 的设定。举例来说,如果选择语言简体中文登录到 X
Window,或者正在使用 CXTERM [10] 的话,那么该选项应被设为
GB2312;如果使用缺省的语言(LANG=en_US.UTF-8)登录到 X Window,或者使用 PuTTY [11] 远程访问
Linux 机器、并且设定里的字符编码(配置中 Window-Translation)设为 UTF-8 的话,该选项就应该设为
utf-8。从 Windows 下使用 PuTTY 远程连接 Linux 的请特别注意,测试表明,仅在使用 UTF-8
的情况下,PuTTY 才能可靠地支持中文的显示和输入(显示字体必须设成中文字体)。
fileencoding:文件载入时,该选项被置为 Vim
认定的文件编码,因此,存储时文件的编码不会改变。 此处和下面 fileencodings 可使用的编码为
libiconv 支持的所有几百种编码(如果编译时包含了 iconv 特性的话),与中文相关的有
gb2312、gbk、gb18030、hz-gb-2312、iso-2022-cn、big5、cp936、cp950
等。如果创建新文件,你又不希望使用 UTF-8 作为文件编码时,那么,你可能需要手工设定该选项,如“:set
fileencoding=gb2312”。需要注意的一点是,使用“set”来设定该选项的话会改变以后新建文件的缺省编码,而使用“setlocal”的话则只影响当前文件(参考“:help
setlocal”)。
fileencodings=ucs-bom,utf-8,chinese:Vim
会首先判断文件的开头是否是一个 Unicode [7] 的 BOM(byte order mark)字符
[8],是的话则把文件的其余内容解释成相应的 Unicode 序列;否的话再试图把文件内容解释成 UTF-8
的序列;再失败的话,则把文件解释为简体中文(chinese
是一个跨平台的简体中文字符集的别名,Linux 下相当于 gb2312 和 euc-cn;此处也可以根据需要以 gb2312、gbk
或 gb18030 等编码替代)。需要注意的是,该顺序不能颠倒,并且在后面再添加其它编码如 big5、latin1
也是没有意义的,因为 Vim 不能识别 8 比特编码中的错误,因此这些编码后列的编码永远不会被用到。
ambiwidth=double: 把所有的“不明宽度”字符 [9]——指的是在 Unicode
字符集中某些同时在东西方语言中使用的字符,如省略号、破折号、书名号和全角引号,在西方文字中通常字符宽度等同于普通 ASCII
字符,而在东方文字中通常字符宽度等同于两倍的普通 ASCII
字符,因而其宽度“不明”——的宽度置为双倍字符宽度(中文字符宽度)。此数值只在 encoding 设为 utf-8 或某一
Unicode 编码时才有效。需要额外注意的是,如果你通过终端使用 Vim 的话,需要令终端也将这些字符显示为双宽度。比如,XTERM
[12] 的情况下应该使用选项“-cjk”,即使用命令“uxterm -cjk”来启动使用双宽度显示这些字符的 Unicode X
终端;使用 PuTTY 远程连接的话则应在配置的 Window-Translation 中选中“Treat CJK ambiguous
characters as wide”