linux查看文件是不是gbk,Linux_linux下文件编码的查看与转换,通常来说,Windows中默认的文件 - phpStudy...

linux下文件编码的查看与转换

通常来说,Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8,所以Linux下打开windows的文件会有乱码的情况。另外,有时要将文件进行编码转换,如将简体中文转换为繁体中文。

基于以上情况,本文将就在linux下查看和转换文件的编码进行说明。

1.查看文件的编码

1)在Vim中可以直接查看文件编码

:set fileencoding    即可显示文件编码格式。

2)enca查看文件编码

# enca filename        直接用enca加文件名查看

# enca -L zh_CN filename

注:enca对某些GBK编码的文件识别不是很好,识别时会出现:unrecognized encoding.

2.转换文件的编码

1)在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

:set fileencoding=utf-8

2)enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,如:

# enconv -L zh_CN -x UTF-8 filename

# enca -L zh_CN -x UTF-8 < file1 > file2        不覆盖原文件

3)iconv 转换,iconv的命令格式如下:

# iconv -f encoding -t encoding inputfile

# iconv -l    查询可用编码

# for i in `find ./ -name *.html`;do echo $i;iconv -f gb2312 -t big5 $i -o /tmp/iconv.tmp;mv /tmp/iconv.tmp $i;done

批量转换文件编码实例之一

3.文件名编码转换

Linux与windows间拷贝文件,有时文件名会出现乱码,是因为Windows的文件名中文编码默认为GBK,而Linux默认的文件名为UTF8。在Linux中有个工具,convmv,可以对文件名进行GBK和UTF的相互转换。

用法:

Convmv -f 源编码 -t 新编码 [option] filename

安装enca

下载相关rpm包。地址(http://rpmfind.net/linux/RPM/dag/redhat/el5/i386/ )

我下载的是:enca-1.10-1.el5.rf.i386.rpm和enca-devel-1.10-1.el5.rf.i386.rpm

安装:

# rpm -ivh enca-1.10-1.el5.rf.i386.rpm

# rpm -ivh  enca-devel-1.10-1.el5.rf.i386.rpm相关阅读:

让windows系统自动关闭停止响应的程序

技巧:获取路径的文件名及其目录名

调教Windows server 2008系统菜单

ASP+Access莫名奇妙的sql语句错误解决

详细解读PHP链接WEB SERVICE类

挖掘Windows7系统潜能提升IE8自我保护能力

一个模仿oso的php论坛程序源码(之三)

php删除页面记录 同时刷新页面 删除条件用GET方式获得

asp.net下将图片保存到XML文件的方法

BytesToBstr获取的源码转换为中文的代码

jQuery教程:检测网页标准的W3C盒子模型

通过js脚本复制网页上的一个表格的不错实现方法

將datagrid控件內容輸出到excel文件

js实现DIV的一些简单控制

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值