ISO 8859(GBK) 编码文件转码到UTF-8编码文件

原创 2015年07月10日 18:05:52

问题产生:

         现需要把一个在windows的Myeclipse下开发的小程序,转到Linux系统下去安装运行,结果程序中的.java文件中的中文到Linux下vim显示全是乱码。

       现做以下分析:其主要原因是windows中Myeclipse中默认的文件编码格式为GBK或GB2312格式,而Linux系统默认的文件格式是UTF-8, 这样在windows下GBK格式的中文,到Linux下vim查看中文全部显示乱码,英文正常。


解决办法:      

      1. 修改vim配置文件,使得用vim可以正常查看文件中的中文字符,但是此法并没有改变源文件的编码格式

             具体方法:找到linux系统下的vimrc文件(目录/usr/share/vim/vimrc)用root权限打开并在文件末尾添加下面四行代码:

   set fileencodings=utf-8,gb2312,gbk,gb18030

   set termencoding=utf-8

   set fileformats=unix

   set encoding=prc

              再用vim打开,就可以正常显示乱码的文件了。(记住但并未改变源文件的编码格式,只是vim读文件时自己完成了转码)

      2. 改变windows下的源码文件的编码格式为Linux下编码格式

             先说下查看文件编码格式的命令:

                (1)用vim打开文件的话可以输入 :set fileencoding 回车查看

                (2)用命令  file 文件名       例如   file  a.txt      查看a.txt 的文件编码格式

             然后就是具体的转码操作:

                   Linux可以用iconv命令进行文档的转码操作,具体命令格式:

                                   iconv -f GBK -t UTF-8  待转码文件名  -o  输出文件名

                    解释下此命令,其中  -f 接的是代转文件编码格式(即被转码格式)  -t  接的是目标文件编码格式(即目标编码格式)

                    -o  表示输出。上面完成了  将待转码文件(GBK编码格式) 转换成 输出文件(UTF-8编码格式) ,也就是完成了从GBK到UTF-8的转换。(提示:要想转码后不产生新文件,把代转文件名和输出文件名写成同一个就行了)

                    举例:iconv   -f   ISO-8859  -t  UTF-8   zhuan.java   -o   zhuan.java

                      


        













版权声明:此文版权博主所有,转载请注明出处

乱码转中文输出(ISO-8859-1 to UTF-8)

直接上代码了: public class ToChinese { /** * @param args */ /** * @param args */ public static...
  • aitcax
  • aitcax
  • 2014年11月26日 10:01
  • 8047

GBK,UTF-8,和ISO8859-1之间的编码与解码

Unicode、UTF-8 和 ISO8859-1到底有什么区别 将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF...
  • xiongchao2011
  • xiongchao2011
  • 2012年02月20日 19:03
  • 48474

常见编码GBK、GB2312、UTF-8、ISO-8859-1的区别

在项目开发中,会经常遇到不同的编码方式。不管什么编码,都是信息在计算机中的一种表现,理解常见的编码方式,有助于我们避免出现乱码等现象。 最初的计算机字符编码是通过ASCII来编码的,是现今最通用的单...
  • shijing_0214
  • shijing_0214
  • 2016年03月16日 20:38
  • 6117

如何在 Linux 中将文件编码转换为 UTF-8

转自 https://linux.cn/article-7959-1.html 在这篇教程中,我们将解释字符编码的含义,然后给出一些使用命令行工具将使用某种字符编码的文件转化为...
  • skykingf
  • skykingf
  • 2016年11月15日 16:28
  • 6850

将ISO-8859-1编码字符串转换UTF-8编码

/** * 字符串转换编码 * @author Administrator * */ public class StringEncode { /** * 将ISO-8859-1编码字符...
  • shiyuezhong
  • shiyuezhong
  • 2012年10月12日 15:20
  • 9106

Mac OS X下各种文件编码的转换方法

何曾几时本猫还在windows下编码的时候,那时ruby的源代码的编码格式都是gbk啊!导致N多中文显示为乱码。后来无奈写了个转换代码从gbk编码转为utf-8格式的小工具: #!/usr/bin/...
  • mydo
  • mydo
  • 2014年12月06日 21:47
  • 17697

IO流-转换流的字符编码转换-ISO-8859-1和utf-8和GBK互转

/*IO流-转换流的字符编码转换-ISO-8859-1和utf-8和GBK互转 编码:字符串变成字节数组解码:字节数组变成字符串String-->byte[]: str.getBytes(); ...
  • blacop
  • blacop
  • 2016年08月02日 23:49
  • 4990

linux 文件编码格式转换

如果你需要在Linux中操作windows下的文件,那么你可能会经常遇到文件编码转换的问题。Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8。下面介绍一下,在Li...
  • hcx25909
  • hcx25909
  • 2013年03月30日 21:41
  • 10465

linux文件转码工具iconv

系统自带的,无需另外安装 [root@db2-test1 test]# iconv --help Usage: iconv [OPTION...] [FILE...] Convert encodin...
  • paololiu
  • paololiu
  • 2017年01月12日 15:10
  • 1528

linux文件转码命令iconv

linux系统里提供的文件转化编码的命令iconv,使用如下:   iconv -t utf-8 -f gb2312 -c my_database.sql > new.sql -f  原编码...
  • wusecaiyun
  • wusecaiyun
  • 2016年01月10日 19:39
  • 734
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:ISO 8859(GBK) 编码文件转码到UTF-8编码文件
举报原因:
原因补充:

(最多只允许输入30个字)