Node.js读写中文内容文件操作

于Node.js仅支持如下编码:utf8, ucs2, ascii, binary, base64, hex,并不支持中文GBK或GB2312之类的编码,

因此如果要读写GBK或GB2312格式的文件的中文内容,必须要用额外的模块:iconv-lite


1、安装模块:npm install iconv-lite

2、演示代码,把下面的代码复制到一个文件中,假设是ch.js(注意:js文件必须保存为utf8编码格式):

[javascript] view plain copy
  1. // 加载File System读写模块  
  2. var fs = require('fs');  
  3. // 加载编码转换模块  
  4. var iconv = require('iconv-lite');   
  5.   
  6. var file = "c:\\a.txt";  
  7. writeFile(file);  
  8. readFile(file);  
  9.   
  10. function writeFile(file){  
  11.     // 测试用的中文  
  12.     var str = "\r\n我是一个人Hello myself!";  
  13.     // 把中文转换成字节数组  
  14.     var arr = iconv.encode(str, 'gbk');  
  15.     console.log(arr);  
  16.       
  17.     // appendFile,如果文件不存在,会自动创建新文件  
  18.     // 如果用writeFile,那么会删除旧文件,直接写新文件  
  19.     fs.appendFile(file, arr, function(err){  
  20.         if(err)  
  21.             console.log("fail " + err);  
  22.         else  
  23.             console.log("写入文件ok");  
  24.     });  
  25. }  
  26.   
  27. function readFile(file){  
  28.     fs.readFile(file, function(err, data){  
  29.         if(err)  
  30.             console.log("读取文件fail " + err);  
  31.         else{  
  32.             // 读取成功时  
  33.             // 输出字节数组  
  34.             console.log(data);  
  35.             // 把数组转换为gbk中文  
  36.             var str = iconv.decode(data, 'gbk');  
  37.             console.log(str);  
  38.         }  
  39.     });  
  40. }  

3、用node.exe执行这个js文件,结果如下:
  1. C:\>node ch.js  
  2. <Buffer 0d 0a ce d2 ca c7 d2 bb b8 f6 c8 cb 48 65 6c 6c 6f 20 6d 79 73 65 6c 66 21>  
  3. 写入文件ok  
  4. <Buffer 0d 0a ce d2 ca c7 d2 bb b8 f6 c8 cb 48 65 6c 6c 6f 20 6d 79 73 65 6c 66 21>  
  5.   
  6. 我是一个人Hello myself!  
  7.   
  8. C:\>  

注1:Node的iconv模块,仅支持linux,不支持Windows,因此要用纯js的iconv-lite,另:作者说iconv-lite的性能更好,具体参考git站点:iconv-lite

注2:我在测试读写文件时,始终无法把中文写入文件,一直乱码,读取正常,后来同事帮我发现:js文件的编码格式是ansi,nodejs的代码文件必须是utf8格式

注3:如果程序操作的文件,都是以UTF8编码格式保存的,那么就不需要使用iconv模块,直接以utf8格式读取文件即可,如:

[javascript] view plain copy
  1. // 参数file,必须保存为utf8格式,否则里面的中文会乱码  
  2. function readFile(file){  
  3.     // readFile的第2个参数表示读取编码格式,如果未传递这个参数,表示返回Buffer字节数组  
  4.     fs.readFile(file, "utf8"function(err, data){  
  5.         if(err)  
  6.             console.log("读取文件fail " + err);  
  7.         else{  
  8.             // 读取成功时  
  9.             console.log(data);// 直接输出中文字符串了  
  10.         }  
  11.     });  
  12. }  

结论:使用node.js开发时,无论是代码文件,还是要读写的其它文件,都建议使用UTF8编码格式保存,这样可以无需额外的模块支持

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值