ubuntu 修改txt文件编码方式(iconv)

  1. 查看文件编码方式
    file **.txt
    这里写图片描述

  2. 修改文件编码方式
    2.1编码的问题
    GB2312是国家制定的汉字编码标准,使用双子节进行编码,共收入6763个汉字和682个非汉字图形字符。GBK即对国标编码的扩展,在GB2312的基础上进行扩展形成的,使用双子节编码方式,共收入21003个汉字,从而大大满足了汉字使用的需要。
    如上图所示:
    文件编码为iso8859
    ps:我想直接iso8859转换编码不行,于是曲线救国了一下,说没有这个字符集,可能是我打错了吧
    iso8859采用单字节编码
    gb2312采用双字节编码,兼容iso8859
    而GBK是对gb2312的扩展,在双字节上增加了更多的汉字
    所以可以采用GBK的方式进行转码
    最好提前备份一下
    cp /home/ubuntu/Downloads/test2.txt /home/ubuntu/Downloads/test2cp.txt

    开始修改

 sudo iconv -f 'gbk' -t 'utf-8' 源文件 > 目标文件

比如:sudo iconv -f ‘gbk’ -t ‘utf-8’ Downloads/test2.txt > Downloads/123.txt
这里写图片描述
可以看到文件编码方式的改变

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值