linux 打开文档没中文,Ubuntu 16.04 LTS系统里中文txt文件打开的问题解决

前言

大家都知道,Ubuntu系统对中文的支持还是比较友好,除了对TEXT文件编码的识别有点问题以外。

16db939a2c6ec6029b0c460d6488f87b.png

gedit直接打开中文txt文件

出现这种问题的原因是txt文件是在Windows环境下生成,Ubuntu下文本阅读器如vim和gedit对文件编码格式不能自动识别。

这里给出几种可能的解决方案。

文件格式转换

利用 dos2unix unix2dos unix2mac 等命令将txt文件从源操作系统转换到目标操作系统。

如果这几个命令不存在,请使用下面的命令进行安装。

sudo apt install dos2unix

sudo apt install unix2dos

使用如下命令进行格式转换:

dos2unix [options] [FILE ...] [-n INFILE OUTFILE ...]

unix2dos [options] [FILE ...] [-n INFILE OUTFILE ...]

这种转换会改变原来文件的一些属性如生成时间等。如果文件需要从两个不同操作系统进行访问时,这个解决方案是不合适的。

.VIMRC设置缺省编码格式

这个解决方案适合我这样的vim爱好者。

be835c1eb09a83d2d6b31d9dc03e009f.png

VIM打开乱码

解决问题的方法是按照下图修改 /etc/vim/vimrc 或者是 /etc/vim/vimrc.local 文件。

/etc/vim/vimrc中会调用/etc/vim/vimrc.local。修改两者中任一个都行。推荐修改/etc/vim/vimrc.local。

a8e7ed14a0e3c47c080c66559fbb4f04.png

vimrc修改

然后再次使用vim打开同样的文件,bingo,搞定。

702aa9e9b47809e63d868643bce380df.png

vim正常打开文件

gedit强制限定编码打开

gedit是Ubuntu下强大的文本编辑软件。直接使用gedit来打开中文txt文件是最有吸引力的解决方案。

其实这个解决方案更简单。

首先使用 chardet3 来检测文件的编码格式。

chardet3 常用的正则表达式总结.txt

运行的结果显示该文件的编码格式是GB2312:

常用的正则表达式总结.txt: GB2312 with confidence 0.99

知道了编码格式后可以在运行gedit时加入encoding选项,如下

gedit --encoding GB2312 常用的正则表达式总结.txt

同样可以正常打开该txt文件,如下图所示。

eaff7dd48e5d72c74dcf1746b9438d4f.png

gedit打开文件

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值