关闭

ISO 8859(GBK) 编码文件转码到UTF-8编码文件

标签: Iconv 编码转换 ISO-utf-8
1930人阅读 评论(0) 收藏 举报
分类:

问题产生:

         现需要把一个在windows的Myeclipse下开发的小程序,转到Linux系统下去安装运行,结果程序中的.java文件中的中文到Linux下vim显示全是乱码。

       现做以下分析:其主要原因是windows中Myeclipse中默认的文件编码格式为GBK或GB2312格式,而Linux系统默认的文件格式是UTF-8, 这样在windows下GBK格式的中文,到Linux下vim查看中文全部显示乱码,英文正常。


解决办法:      

      1. 修改vim配置文件,使得用vim可以正常查看文件中的中文字符,但是此法并没有改变源文件的编码格式

             具体方法:找到linux系统下的vimrc文件(目录/usr/share/vim/vimrc)用root权限打开并在文件末尾添加下面四行代码:

   set fileencodings=utf-8,gb2312,gbk,gb18030

   set termencoding=utf-8

   set fileformats=unix

   set encoding=prc

              再用vim打开,就可以正常显示乱码的文件了。(记住但并未改变源文件的编码格式,只是vim读文件时自己完成了转码)

      2. 改变windows下的源码文件的编码格式为Linux下编码格式

             先说下查看文件编码格式的命令:

                (1)用vim打开文件的话可以输入 :set fileencoding 回车查看

                (2)用命令  file 文件名       例如   file  a.txt      查看a.txt 的文件编码格式

             然后就是具体的转码操作:

                   Linux可以用iconv命令进行文档的转码操作,具体命令格式:

                                   iconv -f GBK -t UTF-8  待转码文件名  -o  输出文件名

                    解释下此命令,其中  -f 接的是代转文件编码格式(即被转码格式)  -t  接的是目标文件编码格式(即目标编码格式)

                    -o  表示输出。上面完成了  将待转码文件(GBK编码格式) 转换成 输出文件(UTF-8编码格式) ,也就是完成了从GBK到UTF-8的转换。(提示:要想转码后不产生新文件,把代转文件名和输出文件名写成同一个就行了)

                    举例:iconv   -f   ISO-8859  -t  UTF-8   zhuan.java   -o   zhuan.java

                      


        













0
0

猜你在找
【直播】机器学习&数据挖掘7周实训--韦玮
【套餐】系统集成项目管理工程师顺利通关--徐朋
【直播】3小时掌握Docker最佳实战-徐西宁
【套餐】机器学习系列套餐(算法+实战)--唐宇迪
【直播】计算机视觉原理及实战--屈教授
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之矩阵--黄博士
【套餐】微信订阅号+服务号Java版 v2.0--翟东平
【直播】机器学习之凸优化--马博士
【套餐】Javascript 设计模式实战--曾亮
查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:18293次
    • 积分:322
    • 等级:
    • 排名:千里之外
    • 原创:13篇
    • 转载:11篇
    • 译文:0篇
    • 评论:1条
    文章分类