使用 Ubuntu乱码最郁闷的事莫过于乱码了,网页中的flash乱码、TXT文档乱码,歌曲信息乱码、mplayer播放器字幕乱码,wine乱码等等。居然装10.04以后,竟然发现TXT文件还是一片乱码,并且那乱的水平比Windows的乱码还要高。为了使用Windows下保存的TXT文件,不得不找各种方法。这些是常见的。
==txt乱码
终端输入:gconf-editor(有点类似Windows下的注册表)
依次打开:apps—gedit2—preferences— encodings双击右边的“auto_detected”输入:gb18030,点向上把它移动到第二位,即utf-8下面就可以了。(本人试过移到最上面,后果就是以后右键新建“空文件”时双击打不开,郁闷了好久。。)
这样打开TXT就不会乱码了。
==FLASH乱码
终端中输入:sudo gedit /etc/fonts/conf.d/49-sansserif.conf
将其中的第1、2、4个后面的sans-serif用你自己系统中的中文字体的名字代替,
比如:系统中安装了“文泉驿微米黑”(文泉驿,ubuntu中文自带),则用“文泉驿微米黑”代替上述所说的字段,结果如下:
<match target=”pattern”>
<test qual=”all” name=”family” compare=”not_eq”>
<string>文泉驿微米黑</string>
</test>
<test qual=”all” name=”family” compare=”not_eq”>
<string>文泉驿微米黑</string>
</test>
<test qual=”all” name=”family” compare=”not_eq”>
<string>monospace</string>
</test>
<edit name=”family” mode=”append_last”>
<string>文泉驿微米黑</string>
</edit>
</match>
保存退出,FLASH就好了。
==Audacious播放器歌曲乱码
方法一:
打开并选中Audacious--“ctrl+p” 或 右键"preference"--右栏选“播放列表”--左栏“标题格式”选“自定义”--左栏“自定义字符串”输入:%f
搞定Audacious乱码。
方法二:(没试过)
安装mutagen:sudo apt-get install python-mutagen
然后转到你的MP3目录,例如我的歌曲放在系统的音乐文件夹则输入:cd /home/holmesrain(此为我的用户名,你需要换成你的用户名)/音乐
执行以全命令进行转换:mid3iconv -e GBK *.mp3。完成以后用播放器导入就不会有Ubuntu乱码了。
==盘符乱码(也没试过,9.10还乱码着,但至少现在的10.04不会了,吼吼~~)
终端执行: sudo gedit /etc/fstab ,找到这一行:
/dev/scd0 /media/cdrom0 udf,iso9660 user,noauto 0 0
在options里添加一句iocharset=utf8即可,如下所示:/dev /scd0 /media/cdrom0 udf,iso9660 user,noauto,iocharset=utf8 0 0
以后遇到含中文的光盘就不会出现Ubuntu乱码和问号了。
==PDF乱码
方法太多了,仅说最简单的,需要的话可以了解下其他的forum.ubuntu.org.cn/viewtopic.php
终端输入:sudo apt-get install xpdf xpdf-chinese-simplified
基本上是完美解决了。
本人也仅遇到过以上这些了,还有牛人乱得一塌糊涂的就爱莫能助了~~
以上皆由网络整理而来,自然包括下面这些话:
也许,很多人就会说Ubuntu LInux的不是,认为系统对中文的支持实在是太差。殊不知,Ubuntu乱码问题并不是Ubuntu的错。比如说,Ubuntu下双击Windows下保存的 TXT,就是乱码。但是右击,选择用OpenOffice打开,就会出现一个提示,选择GB18030或者Unicode的编码方式,就可以很好的打开了,没有任何Ubuntu乱码。其实,Ubuntu乱码出现全部是编码方式的问题。Ubuntu默认的是UTF-8,在UTF-8的编码的传输过程中即使丢掉一个字节,根据编码规律也很容易定位丢掉的位置,不会影响到其他字符,故这种编码非常适合作为传输编码。正式它的稳定性与国际标准性使得Ubuntu 选择了它。 Windows下,TXT都是默认保存为ANSI编码方式的,不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。我们也经常会遇到,Windows下,从网页保存大量文字时可能出现无法保存的提示。
当然,使用UTF-8汉字要3个字节,而ANSI只需要2个字节。从这一点来说,Ubuntu对中国人还是不够“人性化”。
这个也让我想起了网页标准。国际标准为W3C,而微软凭借IE捆绑式的推广模式,弃国际标准以不顾,给整个网络的兼容性带来了严重的阻碍。可是即使如此,人们也是宁愿开发适合IE标准的网页已解决兼容性问题,而不是找找问题的本质。后Opera向欧盟执委会申诉,指控微软的浏览器措施妨碍竞争。微软因为未能遵守欧盟先前下达的裁决令,而遭到破纪录的罚金。至此,微软的IE8才有了兼容模式来兼容玩w3c标准。
使ubuntu正常显示GB2312、GBK编码文件
ubuntu环境设置的字符集utf8,windows默认字符集是GBK,Ubuntu的默认字符集为utf-8,这使 得在用telnet登录远程服务器或查看windows文件时出现乱码。需要将ubuntu环境设置为GBK或GB2312,或设置软件使其正确显示汉 字。下面以GBK字符集为例进行说明:
一、修改Ubuntu默认字符集为GBK
1、首先设置sudo vi /var/lib/locales/supported.d/local
添加一行 zh_CN.GBK GBK
sudo locale-gen生成locale
2、修改ubuntu的字符集
方法一: 修改用户目录下的.profile文件,增加以下内容:
LANGUAGE=”zh_CN:zh:en_US:en”
LANG=zh_CN.GBK
重新登录即可。
这个方法只对该用户有效。
方法二:修改/etc/environment,增加以下内容:
LANGUAGE=”zh_CN:zh:en_US:en”
LANG=zh_CN.GBK
然后重启X即可
这个方法对没有设置LANG及LANGUAGE环境变量的用户有效
二、设置软件命名其正常显示GBK
这需要软件本身支持多字符编码,最常见的是IE等浏览器,可以通过设置编码显示GBK字符集。Ubuntu下的一些软件也支持此功能,以ubuntu的终 端程序为例,使其正常显示GBK编码的方法是:在termial窗口上点击菜单:终端->设置字符编码->选择GBK即可。
##########################################
解决文件名,mp3标签,文本文件的中文乱码
从windows转移到ubuntu的用户,常常会发现自己在windows下创建/下载/保存的文件经常性出现乱码问题(kubuntu出现问题的可能性更高一些)。而使用默认播放器打开以往的音乐文件(mp3等)时,出现乱码的机会更是接近100%。
这些问题的解决方案在ubuntu使用技巧中已被收录,但是由于问题的普遍性,我认为有必要转移到这里。
转换文件名由GBK为UTF8
sudo apt-get install convmvconvmv -r -f cp936 -t utf8 --notest --nosmart *转换文件内容由GBK到UTF8iconv -f gbk -t utf8 $i > newfile
转换 mp3 标签编码
sudo apt-get install python-mutagenfind . -iname “*.mp3” -execdir mid3iconv -e GBK {} \;#####################################buntu默认的打开.txt文件用的是gedit,可gedit默认编码是UTF8,打开windows下编辑的gb2312的文档都是乱码。解决方法之一就是把gedit的编码改为GB2312,方法如下:在Applications菜单上点右键,选择EditMenu.在MainMenu的对话框中勾选SystemTools-ConfigurationEditor,并从Applications菜单中开启。依次开启/apps/gedit-2/preferences/encodings/双击右侧auto_detected,在弹出对话框中点选Add,添加Values值为GB2312,确定后选中,点选Up按钮将其移至第一位。同样方法,对show_in_menu进行设置,并将GB2312置于首位。还有一种方法是用openoffice打开.txt文件时,会让你选择编码,选GB2312就行了。***********************************************
1.系统默认编码
我们知道在中文 Windows 下一般来说系统的默认编码是 GBK, 从 Java 开发的角度来说, 就是在进行诸如 Java 源代码编译, 文件读写等操作时, 默认使用的编码是 GBK; 而我们参照一般的 Ubuntu 中文安装文档, 可能会建议将默认的语言设置为 zh_CN.UTF-8, 这样会带来一些问题, 比如我在 Windows 使用 Eclipse 时的编辑器的默认编码是 GBK, 但是在 Ubuntu 下面就是 UTF-8, 同样是使用 Eclipse, 在 Windows 下的中文文档到了 Ubuntu 中会产生乱码, 必须手工逐个文档设置属性中的编码为 GBK 才可以正常; 一些测试代码也是以默认编码读取文件的, 这些代码读取出来的文件内容也会包含乱码.
所以, 最好是将系统的默认编码设置为 GBK, 这样和 Windows 下面的开发环境最接近. 设置的方法应该不止一种, 我采用的是编辑 /etc/environment, 改成这个样子:
LANGUAGE="zh_CN:zh:en_US:en"
GST_ID3_TAG_ENCODING=GBK
LANG=zh_CN.GBK
LC_CTYLE=zh_CN.GBK
**********************************************
Ubuntu 中文编码设置
今天开始把工作环境全部迁移到Linux,一天下来,算平静。很庆幸当初在win下面用了Mozilla Thunderbird邮件客户端,而不是OutLook,这简直太方便了,可以直接把上百兆的邮件存放目录复制到linux下直接用,与之形成鲜明对比 的是微软的新版live Messager,今天发现微软的这个东西甚至不支持安装在他们自己的WinXP 64/Wind2003/2008上面?我没有什么可说的呢。
Ubuntu 默认采用UTF8编码,可以方便global。但对中文支持,还不细致,即便默认采用中文安装,也并不会自动添加GB*等支持,致使在Ubuntu下访问部分Win文本文件时,出现乱码。
I. 配置系统环境
执行 sudo vi /var/lib/locales/supported.d/zh
加入以下配置参数
zh_CN.GB18030 GB18030 (最新汉字编码字符集,向下兼容GBK,GB2312)
zh_CN.GBK GBK (汉字扩展编码,向下兼容GB2312, 并包含BIG5全部汉字)
zh_CN.GB2312 GB2312 (简化汉字编码字符集, 最近有客户要我们改进GB2312,太看得起我们了,我只能说:"NO!")
zh_CN.GB18031 GB18031 (数字键盘汉字编码输入,面向手持设备,我的Nokia3120从来就是发短信,接听电话,无法和PC通讯,就不用这个了。 maybe用Google Android SDK的大侠们需要这个)
zh_HK.BIG5 BIG5 (繁体)
zh_TW.BIG5 BIG5 (繁体)
然后执行 sudo locale-gen
提示以下信息,成功了
zh_CN.GB18030... done
zh_CN.GBK... done
......
II. 系统环境支持GB*内码了,但用vi, gedit等工具访问文件还会继续乱码,需要针对不同的工具分别配置,使之自己检测支持范围内的编码
e.g. vi
执行 sudo vi /etc/vim/vimrc
加入以下配置参数
let &termencoding=&encoding
set fileencodings=utf-8,gb18030,gbk,gb2312,big5
e.g. gedit
执行 sudo gconf-editor
选择 apps/gedit-2/preferences/encodings
找到 auto_detected 编辑,在Values中分别加入 GB18030,GBK,GB2312,BIG5
转载http://wqtty.blog.163.com/blog/static/105241002010102103217331/
==txt乱码
终端输入:gconf-editor(有点类似Windows下的注册表)
依次打开:apps—gedit2—preferences— encodings双击右边的“auto_detected”输入:gb18030,点向上把它移动到第二位,即utf-8下面就可以了。(本人试过移到最上面,后果就是以后右键新建“空文件”时双击打不开,郁闷了好久。。)
这样打开TXT就不会乱码了。
==FLASH乱码
终端中输入:sudo gedit /etc/fonts/conf.d/49-sansserif.conf
将其中的第1、2、4个后面的sans-serif用你自己系统中的中文字体的名字代替,
比如:系统中安装了“文泉驿微米黑”(文泉驿,ubuntu中文自带),则用“文泉驿微米黑”代替上述所说的字段,结果如下:
<match target=”pattern”>
<test qual=”all” name=”family” compare=”not_eq”>
<string>文泉驿微米黑</string>
</test>
<test qual=”all” name=”family” compare=”not_eq”>
<string>文泉驿微米黑</string>
</test>
<test qual=”all” name=”family” compare=”not_eq”>
<string>monospace</string>
</test>
<edit name=”family” mode=”append_last”>
<string>文泉驿微米黑</string>
</edit>
</match>
保存退出,FLASH就好了。
==Audacious播放器歌曲乱码
方法一:
打开并选中Audacious--“ctrl+p” 或 右键"preference"--右栏选“播放列表”--左栏“标题格式”选“自定义”--左栏“自定义字符串”输入:%f
搞定Audacious乱码。
方法二:(没试过)
安装mutagen:sudo apt-get install python-mutagen
然后转到你的MP3目录,例如我的歌曲放在系统的音乐文件夹则输入:cd /home/holmesrain(此为我的用户名,你需要换成你的用户名)/音乐
执行以全命令进行转换:mid3iconv -e GBK *.mp3。完成以后用播放器导入就不会有Ubuntu乱码了。
==盘符乱码(也没试过,9.10还乱码着,但至少现在的10.04不会了,吼吼~~)
终端执行: sudo gedit /etc/fstab ,找到这一行:
/dev/scd0 /media/cdrom0 udf,iso9660 user,noauto 0 0
在options里添加一句iocharset=utf8即可,如下所示:/dev /scd0 /media/cdrom0 udf,iso9660 user,noauto,iocharset=utf8 0 0
以后遇到含中文的光盘就不会出现Ubuntu乱码和问号了。
==PDF乱码
方法太多了,仅说最简单的,需要的话可以了解下其他的forum.ubuntu.org.cn/viewtopic.php
终端输入:sudo apt-get install xpdf xpdf-chinese-simplified
基本上是完美解决了。
本人也仅遇到过以上这些了,还有牛人乱得一塌糊涂的就爱莫能助了~~
以上皆由网络整理而来,自然包括下面这些话:
也许,很多人就会说Ubuntu LInux的不是,认为系统对中文的支持实在是太差。殊不知,Ubuntu乱码问题并不是Ubuntu的错。比如说,Ubuntu下双击Windows下保存的 TXT,就是乱码。但是右击,选择用OpenOffice打开,就会出现一个提示,选择GB18030或者Unicode的编码方式,就可以很好的打开了,没有任何Ubuntu乱码。其实,Ubuntu乱码出现全部是编码方式的问题。Ubuntu默认的是UTF-8,在UTF-8的编码的传输过程中即使丢掉一个字节,根据编码规律也很容易定位丢掉的位置,不会影响到其他字符,故这种编码非常适合作为传输编码。正式它的稳定性与国际标准性使得Ubuntu 选择了它。 Windows下,TXT都是默认保存为ANSI编码方式的,不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。我们也经常会遇到,Windows下,从网页保存大量文字时可能出现无法保存的提示。
当然,使用UTF-8汉字要3个字节,而ANSI只需要2个字节。从这一点来说,Ubuntu对中国人还是不够“人性化”。
这个也让我想起了网页标准。国际标准为W3C,而微软凭借IE捆绑式的推广模式,弃国际标准以不顾,给整个网络的兼容性带来了严重的阻碍。可是即使如此,人们也是宁愿开发适合IE标准的网页已解决兼容性问题,而不是找找问题的本质。后Opera向欧盟执委会申诉,指控微软的浏览器措施妨碍竞争。微软因为未能遵守欧盟先前下达的裁决令,而遭到破纪录的罚金。至此,微软的IE8才有了兼容模式来兼容玩w3c标准。
使ubuntu正常显示GB2312、GBK编码文件
ubuntu环境设置的字符集utf8,windows默认字符集是GBK,Ubuntu的默认字符集为utf-8,这使 得在用telnet登录远程服务器或查看windows文件时出现乱码。需要将ubuntu环境设置为GBK或GB2312,或设置软件使其正确显示汉 字。下面以GBK字符集为例进行说明:
一、修改Ubuntu默认字符集为GBK
1、首先设置sudo vi /var/lib/locales/supported.d/local
添加一行 zh_CN.GBK GBK
sudo locale-gen生成locale
2、修改ubuntu的字符集
方法一: 修改用户目录下的.profile文件,增加以下内容:
LANGUAGE=”zh_CN:zh:en_US:en”
LANG=zh_CN.GBK
重新登录即可。
这个方法只对该用户有效。
方法二:修改/etc/environment,增加以下内容:
LANGUAGE=”zh_CN:zh:en_US:en”
LANG=zh_CN.GBK
然后重启X即可
这个方法对没有设置LANG及LANGUAGE环境变量的用户有效
二、设置软件命名其正常显示GBK
这需要软件本身支持多字符编码,最常见的是IE等浏览器,可以通过设置编码显示GBK字符集。Ubuntu下的一些软件也支持此功能,以ubuntu的终 端程序为例,使其正常显示GBK编码的方法是:在termial窗口上点击菜单:终端->设置字符编码->选择GBK即可。
##########################################
解决文件名,mp3标签,文本文件的中文乱码
从windows转移到ubuntu的用户,常常会发现自己在windows下创建/下载/保存的文件经常性出现乱码问题(kubuntu出现问题的可能性更高一些)。而使用默认播放器打开以往的音乐文件(mp3等)时,出现乱码的机会更是接近100%。
这些问题的解决方案在ubuntu使用技巧中已被收录,但是由于问题的普遍性,我认为有必要转移到这里。
转换文件名由GBK为UTF8
sudo apt-get install convmvconvmv -r -f cp936 -t utf8 --notest --nosmart *转换文件内容由GBK到UTF8iconv -f gbk -t utf8 $i > newfile
转换 mp3 标签编码
sudo apt-get install python-mutagenfind . -iname “*.mp3” -execdir mid3iconv -e GBK {} \;#####################################buntu默认的打开.txt文件用的是gedit,可gedit默认编码是UTF8,打开windows下编辑的gb2312的文档都是乱码。解决方法之一就是把gedit的编码改为GB2312,方法如下:在Applications菜单上点右键,选择EditMenu.在MainMenu的对话框中勾选SystemTools-ConfigurationEditor,并从Applications菜单中开启。依次开启/apps/gedit-2/preferences/encodings/双击右侧auto_detected,在弹出对话框中点选Add,添加Values值为GB2312,确定后选中,点选Up按钮将其移至第一位。同样方法,对show_in_menu进行设置,并将GB2312置于首位。还有一种方法是用openoffice打开.txt文件时,会让你选择编码,选GB2312就行了。***********************************************
1.系统默认编码
我们知道在中文 Windows 下一般来说系统的默认编码是 GBK, 从 Java 开发的角度来说, 就是在进行诸如 Java 源代码编译, 文件读写等操作时, 默认使用的编码是 GBK; 而我们参照一般的 Ubuntu 中文安装文档, 可能会建议将默认的语言设置为 zh_CN.UTF-8, 这样会带来一些问题, 比如我在 Windows 使用 Eclipse 时的编辑器的默认编码是 GBK, 但是在 Ubuntu 下面就是 UTF-8, 同样是使用 Eclipse, 在 Windows 下的中文文档到了 Ubuntu 中会产生乱码, 必须手工逐个文档设置属性中的编码为 GBK 才可以正常; 一些测试代码也是以默认编码读取文件的, 这些代码读取出来的文件内容也会包含乱码.
所以, 最好是将系统的默认编码设置为 GBK, 这样和 Windows 下面的开发环境最接近. 设置的方法应该不止一种, 我采用的是编辑 /etc/environment, 改成这个样子:
LANGUAGE="zh_CN:zh:en_US:en"
GST_ID3_TAG_ENCODING=GBK
LANG=zh_CN.GBK
LC_CTYLE=zh_CN.GBK
**********************************************
Ubuntu 中文编码设置
今天开始把工作环境全部迁移到Linux,一天下来,算平静。很庆幸当初在win下面用了Mozilla Thunderbird邮件客户端,而不是OutLook,这简直太方便了,可以直接把上百兆的邮件存放目录复制到linux下直接用,与之形成鲜明对比 的是微软的新版live Messager,今天发现微软的这个东西甚至不支持安装在他们自己的WinXP 64/Wind2003/2008上面?我没有什么可说的呢。
Ubuntu 默认采用UTF8编码,可以方便global。但对中文支持,还不细致,即便默认采用中文安装,也并不会自动添加GB*等支持,致使在Ubuntu下访问部分Win文本文件时,出现乱码。
I. 配置系统环境
执行 sudo vi /var/lib/locales/supported.d/zh
加入以下配置参数
zh_CN.GB18030 GB18030 (最新汉字编码字符集,向下兼容GBK,GB2312)
zh_CN.GBK GBK (汉字扩展编码,向下兼容GB2312, 并包含BIG5全部汉字)
zh_CN.GB2312 GB2312 (简化汉字编码字符集, 最近有客户要我们改进GB2312,太看得起我们了,我只能说:"NO!")
zh_CN.GB18031 GB18031 (数字键盘汉字编码输入,面向手持设备,我的Nokia3120从来就是发短信,接听电话,无法和PC通讯,就不用这个了。 maybe用Google Android SDK的大侠们需要这个)
zh_HK.BIG5 BIG5 (繁体)
zh_TW.BIG5 BIG5 (繁体)
然后执行 sudo locale-gen
提示以下信息,成功了
zh_CN.GB18030... done
zh_CN.GBK... done
......
II. 系统环境支持GB*内码了,但用vi, gedit等工具访问文件还会继续乱码,需要针对不同的工具分别配置,使之自己检测支持范围内的编码
e.g. vi
执行 sudo vi /etc/vim/vimrc
加入以下配置参数
let &termencoding=&encoding
set fileencodings=utf-8,gb18030,gbk,gb2312,big5
e.g. gedit
执行 sudo gconf-editor
选择 apps/gedit-2/preferences/encodings
找到 auto_detected 编辑,在Values中分别加入 GB18030,GBK,GB2312,BIG5
转载http://wqtty.blog.163.com/blog/static/105241002010102103217331/