Mac 中批量修改文件编码格式

本文介绍了Mac上由于编码问题导致的文件乱码情况,并详细讲解了常见的编码格式,包括ASCII、GB2312、Unicode和UTF-8。同时提供了C++实现的编码转换函数,用于ASCII到Unicode、Unicode到ASCII、UTF-8到Unicode以及Unicode到UTF-8的转换。
摘要由CSDN通过智能技术生成

由于编码原因,在sublime等编辑器打开的文件中文出现乱码,需要将文件的编码格式修改为UTF-8

1、进入需要修改文件目录

//方法一:修改目下所有文件编码格式
find * -exec sh -c "enconv -L zh_CN -x UTF-8 {}" \;  //注意后面的结束标示 " \;"
//方法二
mkdir output
find *.txt -exec sh -c "iconv -f GB2312 -t UTF-8 {} > output/{}" \;


注:
查看文件的编码格式命令
    enca filename

 

 

  常见的编码格式

一、ANSII编码

  作为最早的编码方法,ASCII是最基础的编码方法。ASCII码最早只有后7位可以使用,被编码成指令、标点、数字与英文字母,因此这种编码方法叫做"American Standard Code for Infomation Intechange"。由于其它国家使用ASCII码时不存在本国家的字母符号,因此ASCII码发生了扩展,最高一位也用来编码。于是将128到255的编码称为“扩展字符集”。

二、GB2312

  GB2312是对ASCII编码的中文扩展。为了表示汉字,决定不使用ASCII码的扩展字符集,而将128到255的内容进行重新编码,并用两个字节来表示汉字。因此0~127的意义不变,当两个大于128的字节放在一起时就表示一个中文,其中高字节用0xA1~0xF7编码,低字节用0xA1~0xFE。在这些编码中,还包括数字符号、罗马字母、希腊字母以及日语的假名。对于标点符号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值