gbk转utf-8 iconv 编码转换

在Linux环境下,针对爬虫获取的GBK编码数据,通常使用iconv函数进行编码转换至UTF-8。iconv涉及iconv_open、iconv和iconv_close三个关键函数,通过这些函数可以实现字符编码的转换。要了解系统支持的编码,可以运行特定命令查看。
摘要由CSDN通过智能技术生成

linux下面有时候 字符需要进行编码转换(爬虫将gbk转为utf-8编码...),一般可以选择iconv函数。

终端下面  输入    

man 3 iconv

得到  iconv函数的使用方法。

个人看习惯了,msdn文档之后感觉linux下面的文档的看的不是那么爽了。

使用iconv函数进行转码,一般使用三个函数:iconv_open  、 iconv  、iconv_close三个函数。

iconv_t iconv_open(const char* tocode,const char* fromcode)

返回值类似文件句柄的东西,tococode:目标编码,fromcode:来源编码。

终端下面输入下面命令得到系统支持的编码:

iconv --list


然后就是转码函数了:

size_t iconv(iconv_t cd,             char **inbuf, size_t *inbytesleft,
            char **outbuf, size_t *outbytesleft);

cd:刚才iconv_open得到的句柄, inbuf: 需要转码的字符串地址的指针 , inbytesleft:需要转码的长度,outbuf:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值