Node.js 编码转换

最新推荐文章于 2022-02-23 15:48:14 发布

weixin_34253539

最新推荐文章于 2022-02-23 15:48:14 发布

阅读量110

点赞数

文章标签： javascript python 操作系统 ViewUI

原文链接：http://www.cnblogs.com/thinkingthigh/p/4996813.html

版权

Node.js自带的toString()方法不支持gbk，因此中文转换的时候需要加载第三方库，推荐以下两个编码转换库，iconv-lite和encoding。

iconv, iconv-lite和encoding是什么？

iconv：是在类Unix系统中一种标准字符集转换接口，用于在不同字符集编码之间进行转换，最早出现在HP-UX系统中。

iconv-lite：是iconv的纯js实现，支持的编码包括node.js原生编码：utf8, ucs2, ascii, binary, base64；同时支持广泛使用的单字节编码：Windows 125x family, ISO-8859 family, IBM/DOS codepages, Macintosh family, KOI8 family, latin1, us-ascii；多字节编码：gbk, gb2313, Big5, cp950。官方宣称比node-iconv更快。

encoding：是对node-iconv和iconv-lite的再次封装，encoding首先调用node-iconv，如果node-iconv无法解析，则调用iconv-lite作为替代方案。

iconv-lite安装使用

1. 安装

$ npm install iconv-lite

2. 使用

var iconv = require('iconv-lite');

// Convert from an encoded buffer to js string.

str = iconv.decode(buf, 'win1251');

// Convert from js string to an encoded buffer.

buf = iconv.encode("Sample input string", 'win1251');

// Check if encoding is supported

iconv.encodingExists("us-ascii")

复制代码

3. iconv-lite和node-iconv的性能对比

operation iconv@1.2.4 iconv-lite@0.2.4

----------------------------------------------------------

encode('win1251') ~115 Mb/s ~230 Mb/s

decode('win1251') ~95 Mb/s ~130 Mb/s

encoding安装使用

1. 安装

$ npm install encoding

2. 使用

encoding模块就一个方法convert()，使用方法为：encoding.convert(text, toCharset, fromCharset)。

text: 需要转换的对象，可以为Buffer或者String对象。

toCharset: 转换后的编码。

fromCharset: 转换前的编码，缺省为uft8。

转换后的输入结果为Buffer对象。

var encoding = require('encoding');

var result = encoding.convert("ÕÄÖÜ", "Latin_1");

console.log(result); //<Buffer d5 c4 d6 dc>

番外篇：jschardet

什么是jschardet？

jschardet是由António Afonso从Python的chardet移植到 Javascript的jschardet。

1. 安装

$ npm install jschardet

2. 使用

var jschardet = require("jschardet")

// "àíàçã" in UTF-8

jschardet.detect("\xc3\xa0\xc3\xad\xc3\xa0\xc3\xa7\xc3\xa3")

// { encoding: "utf-8", confidence: 0.9690625 }

// "次常用國字標準字體表" in Big5

jschardet.detect("\xa6\xb8\xb1\x60\xa5\xce\xb0\xea\xa6\x72\xbc\xd0\xb7\xc7\xa6\x72\xc5\xe9\xaa\xed")

// { encoding: "Big5", confidence: 0.99 }

转载于:https://www.cnblogs.com/thinkingthigh/p/4996813.html

weixin_34253539

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。