utf-8转unicode
iconv是linux下的编码转换的工具,它提供命令行的使用和函数接口支持
man手册iconv命令用法如下:
iconv -f encoding -t encoding inputfile
有如下选项可用:
输入/输出格式规范:
-f, --from-code=名称 原始文本编码 -t, --to-code=名称 输出编码
信息:
-l, --list 列举所有已知的字符集
输出控制:
-c 从输出中忽略无效的字符 -o, --output=FILE 输出文件 -s, --silent 关闭警告 --verbose 打印进度信息
示例:下面的命令是将一个utf8编码的文件转换为一个unicode编码的文件
iconv -f gbk -t utf-8 gbkfile.txt > utf8file.txt
iconv函数族的头文件是iconv.h,使用前需包含之。
#include <iconv.h>
iconv函数族有三个函数,原型如下:
iconv_t iconv_open(const char *tocode, const char *fromcode);
此函数说明将要进行哪两种编码的转换,tocode是目标编码,fromcode是原编码,该函数返回一个转换句柄,供以下两个函数使用。
size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t *outbytesleft);
cd,上个函数返回的句柄。此函数从inbuf中读取字符,转换后输出到outbuf中,inbytesleft用以记录还未转换的字符数,outbytesleft用以记录输出缓冲的剩余空间。
注意:inbuf和outbuf都必须是有存储空间的不能定义为常量,如:char *inbuf = "abc" 或者是char *outbuf = "123"这样定义都是错误的。另外inbuf,inbytesleft,outbuf,outbytesleft这几个参数在使用过程中都会改变,最好是先保存一下原值,然后再使用
int iconv_close(iconv_t cd);
此函数用于关闭转换句柄,释放资源。
转自:https://www.cnblogs.com/etangyushan/p/3753847.html
封装见有道笔记