Nodejs编码转化问题

最新推荐文章于 2022-05-26 10:36:57 发布

weixin_30642029

最新推荐文章于 2022-05-26 10:36:57 发布

阅读量775

点赞数

文章标签： javascript 操作系统 ViewUI

原文链接：http://www.cnblogs.com/cocos2014/p/4282024.html

版权

目前Node.js仅支持hex、utf8、ascii、binary、base64、ucs2几种编码的转换。对于GBK，GB2312等编码，Nodejs自带的toString()方法不支持，因此中文转化的时候需要加载第三方库，主要有两个编码转换库iconv-lite和encoding，个人推荐使用encoding。

iconv-lite：是 iconv 的纯 js 实现，支持的编码包括 node.js 原生编码：utf8, ucs2, ascii, binary, base64；同时支持广泛使用的单字节编码：Windows 125x family, ISO-8859 family, IBM/DOS codepages, Macintosh family, KOI8 family, latin1, us-ascii；多字节编码：gbk, gb2313, Big5, cp950。

encoding：是对 node-iconv 和 iconv-lite 的再次封装，encoding 首先调用 node-iconv，如果 node-iconv 无法解析，则调用 iconv-lite 作为替代方案。

encoding 安装使用

1. 安装

npm install encoding

2.使用

encoding 模块就一个方法 convert()，使用方法为：encoding.convert(text, toCharset, fromCharset)。

text: 需要转换的对象，可以为 Buffer 或者 String 对象。
toCharset: 转换后的编码。
fromCharset: 转换前的编码，缺省为 uft8。

转换后的结果为 Buffer 对象。

1 var encoding = require('encoding');
2 
3 var result = encoding.convert("ÕÄÖÜ", "Latin_1");
4 console.log(result); //<Buffer d5 c4 d6 dc>

下面用实例来说明encoding的使用方法：

1.UTF8转GBK

例如"苏A00001"的GBK的对应形式为"CBD5413030303031".

 1 var fs = require('fs');
 2 var encodingConvert     = require('encoding');
 3 var buf                 = require('buffer');
 4 var temp = "苏A00001";
 5 var result = new String();
 6 
 7 var resultBuffer = encodingConvert.convert(temp, "GBK","UTF8");
 8 console.log("The resultBuffer is:",resultBuffer);
 9 
10 for(var i = 0;i < resultBuffer.length;i++)
11 {
12    
13     result+=resultBuffer.slice(i,i+1)[0].toString(16);
14  
15 }
16 result = result.toUpperCase();
17 
18 console.log("The result is:",result);

即第8行的resultBuffer是一个buffer，其内容就是对应的"CBD5413030303031"，只不过要通过第16行进行大写转化。

第13行的作用就是取Buffer的每一位，resultBuffer.slice(i)的结果为<Buffer cb>,<Buffer d5>,<Buffer 41>,<Buffer 30>,<Buffer 30>,<Buffer 30>,<Buffer 30>,<Buffer 31>.

resultBuffer.slice(i)[0]的结果为203，213，65，48，48，48，48，49，由于Buffer里的是二进制，此结果就是二进制对应的十进制结果，再把其转化成16进制就是最后的结果。

2.GBK转UTF8

 1 var fs = require('fs');
 2 var encodingConvert     = require('encoding');
 3 var buf                 = require('buffer');
 4 
 5 var temp = "CBD5413030303031";
 6 var bufferArray = [0xcb,0xd5,0x41,0x30,0x30,0x30,0x30,0x31];
 7 var buffer = new Buffer(bufferArray);
 8 console.log("The buffer is:",buffer);
 9 console.log(buffer.toString());
10 
11 var plateDecoded = encodingConvert.convert(buffer, "UTF8", "GBK");
12             
13 console.log("The result is:",plateDecoded.toString());

从结果可以得出，如果不使用第11行的代码，则输出的中文是乱码，那是因为"CBD5413030303031"是GBK格式的编码格式，经过第11行的转化，转化成UTF8编码，再进行输出的结果是正确的格式。

转载于:https://www.cnblogs.com/cocos2014/p/4282024.html

weixin_30642029

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Nodejs编码转化问题

目前Node.js仅支持hex、utf8、ascii、binary、base64、ucs2几种编码的转换。对于GBK，GB2312等编码，Nodejs自带的toString()方法不支持，因此中文转化的时候需要加载第三方库，主要有两个编码转换库iconv-lite和encoding，个人推荐使用encoding。iconv-lite：是 iconv 的纯 js 实现，支持的编码包括 no...
复制链接

扫一扫