通过nodejs将ANSI转UTF-8

6 篇文章 0 订阅

需求,批量将歌词lrc内容ANSI转为utf-8

const fs = require('fs');
const path = require('path');
var iconv = require('iconv-lite');
const fileTypes = ['.lrc'];

// 输入目录
const inputFolder = './lrcs/'
// 输出目录
const outFolder = './res/'

function toUtf8(fileName) {
  const filePath = path.join(inputFolder,fileName);
  const outFilePath = path.join(outFolder,fileName);
  let byte = fs.readFileSync(filePath);
  if((byte[0] === 0xef && byte[1] === 0xbb) ||
    (byte[0] === 0xfe && byte[1] === 0xff) || 
    (byte[0] === 0xff && byte[1] === 0xfe)
    ){
      // 已经是utf8
      console.log('object fileName 已经是utf-8,只是拷贝',fileName);
      fs.writeFileSync(outFilePath, byte);
      return;
    }
  byte = iconv.decode(byte,'gbk');
  const content = '\ufeff' + byte.toString('utf8');
  
  fs.writeFileSync(outFilePath,content);
  // console.log('object 写成功',fileName)
}

function convert(folderPath) {
  if(!fs.existsSync(folderPath)){
    console.log('object folderPath',folderPath)
    return
  }
  const files = fs.readdirSync(folderPath);
  files.forEach((fileName,index) => {
    // console.log('object fileName',index,fileName)
    const filePath = path.join(folderPath,fileName);
    const stats = fs.statSync(filePath);
    if(stats.isFile()) {
      // console.log('object fileName',index,fileName)
      const ext = path.extname(filePath).toLowerCase();
      if(fileTypes.indexOf(ext)>-1) {
        toUtf8(fileName)
      }
    } else if(stats.isDirectory()) {
      convert(filePath)
    }
  })
}
convert(inputFolder);

保存文件为index.js

执行:

node index.js
Node.js中,可以使用iconv-lite库来处理UTF-8编码。iconv-lite是一个纯JS实现的库,支持多种编码格式,包括UTF-8。 下面是一个从GBK文件读取内容,然后将编码存为UTF-8编码的例子: ``` var buffer = Buffer.from(fs.readFileSync('gbkFile.txt',{encoding:'binary'}),'binary'); console.log(buffer);//得到文件内容对应的Buffer var text = iconv.decode(buffer,'GBK');//使用GBK解码 console.log(text); fs.writeFileSync('utfFile.txt',iconv.encode(text, 'utf8'),'binary'); //按二进制方式写入 fs.writeFileSync('utfFile2.txt',text,'utf8'); //按UTF8写入。 ``` 这个例子首先使用fs.readFileSync方法读取GBK编码的文件,并将其保存为二进制的Buffer。然后使用iconv.decode方法将Buffer解码为GBK编码的文本。接下来,使用fs.writeFileSync方法将解码后的文本按照UTF-8编码保存为二进制文件utfFile.txt,以及按照UTF-8编码保存为UTF-8文本文件utfFile2.txt。 需要注意的是,Unicode标准允许在UTF-8中使用BOM(字节顺序标记),但一般不建议使用它。在使用Node.js处理UTF-8编码时,通常不需要使用BOM。 <span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Node.js环境中使用GBK编码](https://blog.csdn.net/violentbomb/article/details/52919206)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [gulp-bom:将UTF-8 BOM添加到文件](https://download.csdn.net/download/weixin_42134338/19080088)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值