ISO 8859(GBK) 编码文件转码到UTF-8编码文件

原创 2015年07月10日 18:05:52

问题产生:

         现需要把一个在windows的Myeclipse下开发的小程序,转到Linux系统下去安装运行,结果程序中的.java文件中的中文到Linux下vim显示全是乱码。

       现做以下分析:其主要原因是windows中Myeclipse中默认的文件编码格式为GBK或GB2312格式,而Linux系统默认的文件格式是UTF-8, 这样在windows下GBK格式的中文,到Linux下vim查看中文全部显示乱码,英文正常。


解决办法:      

      1. 修改vim配置文件,使得用vim可以正常查看文件中的中文字符,但是此法并没有改变源文件的编码格式

             具体方法:找到linux系统下的vimrc文件(目录/usr/share/vim/vimrc)用root权限打开并在文件末尾添加下面四行代码:

   set fileencodings=utf-8,gb2312,gbk,gb18030

   set termencoding=utf-8

   set fileformats=unix

   set encoding=prc

              再用vim打开,就可以正常显示乱码的文件了。(记住但并未改变源文件的编码格式,只是vim读文件时自己完成了转码)

      2. 改变windows下的源码文件的编码格式为Linux下编码格式

             先说下查看文件编码格式的命令:

                (1)用vim打开文件的话可以输入 :set fileencoding 回车查看

                (2)用命令  file 文件名       例如   file  a.txt      查看a.txt 的文件编码格式

             然后就是具体的转码操作:

                   Linux可以用iconv命令进行文档的转码操作,具体命令格式:

                                   iconv -f GBK -t UTF-8  待转码文件名  -o  输出文件名

                    解释下此命令,其中  -f 接的是代转文件编码格式(即被转码格式)  -t  接的是目标文件编码格式(即目标编码格式)

                    -o  表示输出。上面完成了  将待转码文件(GBK编码格式) 转换成 输出文件(UTF-8编码格式) ,也就是完成了从GBK到UTF-8的转换。(提示:要想转码后不产生新文件,把代转文件名和输出文件名写成同一个就行了)

                    举例:iconv   -f   ISO-8859  -t  UTF-8   zhuan.java   -o   zhuan.java

                      


        













版权声明:此文版权博主所有,转载请注明出处

linux下查看文件编码及修改编码

查看文件编码 在Linux中查看文件编码可以通过以下几种方式: 1.在Vim中可以直接查看文件编码 :set fileencoding 即可显示文件编码格式。 如果你只是想查看其它编码格式的文件或者想...
  • jnbbwyth
  • jnbbwyth
  • 2011年11月19日 17:38
  • 272901

锟斤拷?UTF-8与GBK互转,为什么会乱码?

中文乱码是怎么产生的,编码转换是怎么回事,编码转换中有哪些需要注意的,本文为你解答!...

C++文件编码由GBK转换UTF-8的解决方法

在VS下面开发Cocos程序的时候,他的默认编码是GBK的,但是在迁移或者是编译调试的时候要求UTF的编码更为方便。因此便有了将C++文件的编码格式转换为UTF-8的需求问题。 这个问题,当然可以...

ISO8859-1 转 Unicode IOS 的

在使用 GDataXMLDocument 拼装XML 时,里面有汉字 转换为字符串时,汉字会变成"临" 这边编码, 经查阅资料 这就是ISO8859-1编码 扩展的ASCII编码。下面的...
  • ranshon
  • ranshon
  • 2013年11月07日 16:04
  • 1895

IO流-转换流的字符编码转换-ISO-8859-1和utf-8和GBK互转

/*IO流-转换流的字符编码转换-ISO-8859-1和utf-8和GBK互转 编码:字符串变成字节数组解码:字节数组变成字符串String-->byte[]: str.getBytes(); ...
  • blacop
  • blacop
  • 2016年08月02日 23:49
  • 4109

GBK,UTF-8,和ISO8859-1之间的编码与解码

Unicode、UTF-8 和 ISO8859-1到底有什么区别 将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF...

linux 文件编码格式转换

如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介绍一下,在Li...
  • hcx25909
  • hcx25909
  • 2013年03月30日 21:41
  • 10002

linux下面如何将文件编码批量转化

命令行下查看看文件的编码 file -i 文件 就会输出linux识别出来的文件编码 一、运用iconv命令执行编码转换文件内容编码转换 iconv -f 现在的编码 -t 要转换的编...
  • ownfire
  • ownfire
  • 2012年12月14日 15:03
  • 6809

如何在 Linux 中将文件编码转换为 UTF-8

转自 https://linux.cn/article-7959-1.html 在这篇教程中,我们将解释字符编码的含义,然后给出一些使用命令行工具将使用某种字符编码的文件转化为...

结合file和iconv命令转换文件的字符编码类型

http://hi.baidu.com/netwrom/blog/item/8885f31ef0d09ae7e1fe0b1c.html 在很多类unix平台上都有一个iconv工具,可以...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:ISO 8859(GBK) 编码文件转码到UTF-8编码文件
举报原因:
原因补充:

(最多只允许输入30个字)