linux下使用iconv转换编码,利用linux下的iconv工具转换文件编码

博主分享了如何使用iconv工具将EUC-JP编码的文件转换为UTF-8编码,遇到的问题及解决方案。通过iconv-l确定源编码,并用脚本批量处理目录下所有文件。同时尝试将文件转换为SJIS编码时遇到错误,通过指定EUCJP-OPEN到SJIS-OPEN成功转换。强调源编码和目标编码匹配的重要性。
摘要由CSDN通过智能技术生成

今天才知道有iconv这个转换编码的工具,

所以想把它用来将EUC-JP的编码转成UTF-8,

因为doxygen的默认处理编码就是UTF-8

命令很简单

但一开始的时候总有一两个文件会报错,后来才知道可能是因为EUC-JP编码的内容太少,

就像GB2312是GBK的一个字集一样,只要找到EUC-JP的父集就可以了.

用iconv -l这个命令查看编码,试了一下EUCJP-OPEN转换的时候没有问题.

因为iconv命令一次只能转换一个文件,所以写成脚本来处理一个目录下的所有文件.

-----------------------------------------------------

#!/bin/bash

for f in $(find src -name "*.[ch]")

do

iconv -fEUCJP-OPEN -tUTF-8 $f>tmp

mv -f tmp $f

done

-----------------------------------------------------

搞定!

后来我又试了同样的文件转成SJIS编码,但还是会报错

iconv: illegal input sequence at position XXXX

后来我换成了

iconv -fEUCJP-OPEN -tSJIS-OPEN $f>tmp

就可以了.

看来源编码和目标编码一定要对应才能转换.

到现在我还不知道怎么选择对应的源编码和目标编码,只能靠感觉了.

阅读(4293) | 评论(0) | 转发(0) |

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值