在linux系统下打开windows文件,发现中文部分都是乱码,主要是因为字符编码不对,需要做下转换。文件的字符编码转换的脚本如下,以简体中文转换为UTF8格式为例,详细步骤如下:
1. 将如下代码保存到脚本文件( eg: cn2utf8);
#! /bin/sh
BIN_ICONV=`which iconv`
BIN_CAT=`which cat`
if [ -f "$1" ];then
${BIN_ICONV} -f GB2312 -t UTF-8 "$1" -o /tmp/iconv.tmp
${BIN_CAT} /tmp/iconv.tmp
fi
exit 0
2. 将文件cn2utf8放到home目录下的~/bin/下;
3. 修改文件属性:chmod 755 cn2utf8
4. 执行脚本: cn2utf8 [src文件名] > [dst文件名]
附:比较常用的字符编码代码对照表(先写这么多,慢慢补充):
简体中文: GB2312
繁体中文: BIG5