Ubuntu下vim中文乱码问题
我在参加某项竞赛的时候下载了一个主办方提供的文件,但是使用vim打开之后发现部分文字为乱码。另外,使用系统自带的Text Editor打开该文件也是同样的乱码。因为文件可正常显示的部分全部为英文或数字,因此我推测可能是中文显示出了问题。通过搜索相关资料,我找到了如下原因及解决方法。
为什么会出现乱码?
在我系统中vim编辑器默认的编码方式为UTF-8,但是原始文件的实际编码方式为GBK,导致vim显示乱码。
怎样才能正确显示?
把文件转码为UTF-8之后正常打开就可以了。给定原始文件编码方式,iconv可以实现转码。
iconv -f source_encoding -t target_encoding from_file > to_file
这里,source_encoding为原始原件编码方式,查找方式见下文,target_encoding为目标文件编码方式,设置为UTF-8,from_file为原始文件,to_file为目标文件。
怎样知道原始文件的编码方式?
我最先使用的方法是,用vim打开原始文件后,在命令模式下输入set fileencoding。我通过这种方法得到的输出是latin1,而不是GBK。这让我一开始做了许多错误的尝试,始终无法得到能够正常显示全文的目标文件。直到现在我依然很困惑为什么输出不是GBK,希望有大神指教。
鉴于对la