ISO 8859(GBK) 编码文件转码到UTF-8编码文件

原创 2015年07月10日 18:05:52

问题产生:

         现需要把一个在windows的Myeclipse下开发的小程序,转到Linux系统下去安装运行,结果程序中的.java文件中的中文到Linux下vim显示全是乱码。

       现做以下分析:其主要原因是windows中Myeclipse中默认的文件编码格式为GBK或GB2312格式,而Linux系统默认的文件格式是UTF-8, 这样在windows下GBK格式的中文,到Linux下vim查看中文全部显示乱码,英文正常。


解决办法:      

      1. 修改vim配置文件,使得用vim可以正常查看文件中的中文字符,但是此法并没有改变源文件的编码格式

             具体方法:找到linux系统下的vimrc文件(目录/usr/share/vim/vimrc)用root权限打开并在文件末尾添加下面四行代码:

   set fileencodings=utf-8,gb2312,gbk,gb18030

   set termencoding=utf-8

   set fileformats=unix

   set encoding=prc

              再用vim打开,就可以正常显示乱码的文件了。(记住但并未改变源文件的编码格式,只是vim读文件时自己完成了转码)

      2. 改变windows下的源码文件的编码格式为Linux下编码格式

             先说下查看文件编码格式的命令:

                (1)用vim打开文件的话可以输入 :set fileencoding 回车查看

                (2)用命令  file 文件名       例如   file  a.txt      查看a.txt 的文件编码格式

             然后就是具体的转码操作:

                   Linux可以用iconv命令进行文档的转码操作,具体命令格式:

                                   iconv -f GBK -t UTF-8  待转码文件名  -o  输出文件名

                    解释下此命令,其中  -f 接的是代转文件编码格式(即被转码格式)  -t  接的是目标文件编码格式(即目标编码格式)

                    -o  表示输出。上面完成了  将待转码文件(GBK编码格式) 转换成 输出文件(UTF-8编码格式) ,也就是完成了从GBK到UTF-8的转换。(提示:要想转码后不产生新文件,把代转文件名和输出文件名写成同一个就行了)

                    举例:iconv   -f   ISO-8859  -t  UTF-8   zhuan.java   -o   zhuan.java

                      


        













版权声明:此文版权博主所有,转载请注明出处

相关文章推荐

GBK,UTF-8,和ISO8859-1之间的编码与解码

Unicode、UTF-8 和 ISO8859-1到底有什么区别 将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF...

深入理解JVM(2)—Java虚拟机内存区域

在Java项目中,内存的分配与回收由Java虚拟机进行管理,为开发者省去了回收内存的工作。不过,当出现内存泄漏和溢出问题的时候,如果不理解虚拟机的内存管理,就会很难发现问题。 Java虚拟机的内存结...

将ISO-8859-1编码字符串转换UTF-8编码

/** * 字符串转换编码 * @author Administrator * */ public class StringEncode { /** * 将ISO-8859-1编码字符...

在Linux/Unix系统下用iconv命令处理文本文件中文乱码问题

iconv命令是运行于linux/unix平台的文件编码装换工具。当我们在linux/unix系统shell查看文本文件时,常常会发现文件的中文是乱码的,这是由于文本文件的编码与当前操作系统设置的编码...
  • s1070
  • s1070
  • 2016-08-24 17:44
  • 2982

关于HTML网页源码的字符编码(charset)格式(GB2312,GBK,UTF-8,ISO8859-1等)的解释

当你通过浏览器,打开某个网站,即某个url地址的时候,你所能正常看到网页的内容,各种文字,都可以正常显示,且没有显示乱码。 此过程,涉及到,浏览器帮你正确解析HTML源码,其中涉及到HTML网页源码...

c++转码基础(2):gbk编码文件转换成无bom的utf-8文件实例

#include #include #include #include using namespace std; extern "C" { #include "lua.h" #i...

java编码 utf-8 gbk iso8859-1

Java支持UTF-8、ISO-8859-1、GBK等各种字体编码,可笔者发现Java中字体编码的问题仍难倒了不少程序员,网上虽然也有不少关于在Java中如何正确显示中文的文章,但都不够全面,笔者特意...

java和jsp中文编码问题的解决方法(ISO8859_1、GBK、UTF-8)(精品)

java和jsp中文编码问题的解决方法(ISO8859_1、GBK、UTF-8) Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之...

黑马程序员-Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

----------- android培训、java培训、java学习型技术博客、期待与您交流! ------------ 在Java中,字符串用统一的Unicode编码,每个字符占用两个字节,...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)