编码相关
zhangge3663
这个作者很懒,什么都没留下…
展开
-
C/C++中char *与wchar_t*的几种转换方法
多字节(char *)和宽字符(wchar_t *)之间的转换有几种方式,下面按照从通用到特殊的顺序逐一介绍。1、C库函数1.1 关键函数 (1) setlocale() 功能:配置地域化信息 头文件:<locale.h> 函数原型:char *setlocale(int category, const c...转载 2020-01-01 10:51:38 · 1666 阅读 · 0 评论 -
HTML转义字符对照表
字符 十进制 转义字符 " &#34 &quot; & &#38; &amp; < &#60; &lt; > &#62; &gt; 不断开空格(non-breaking space) &#160; &nbs转载 2019-01-28 16:08:11 · 235 阅读 · 0 评论 -
CSS转义字符对照表
HTML有许多特殊的字符,您对此有多少了解?平时在WEB制作中,您又有用到多少?或者说你在平时使用之时,是否也会碰到,有许多特殊字符要如何打印出来?比如说“笑脸”,比如说“版权号”。要是你用时忘记了这些特殊字符,不要紧,请记住今天这个地址,你就随时可以查到这些特殊字符的表示方法。简单的介绍一下其使用方法:1、这些字符属于unicode字符集,你的文档需要声明为"utf-8";2、列表符...转载 2019-01-28 16:00:33 · 7657 阅读 · 0 评论 -
JS转义符
在我们写JAVAScript脚本时,可能会要HTML文档显示或使用某些特殊字符(例如:引号或斜线)。(例如:<img src="image5.jpg">)但是前面提到,声明一个字符串时,前后必须以引号括起来。如此一来,字符串当中引号可能会和标识字符串的引号搞混了,此时就要使用转义字符(Escape Character)。 JAVAScript使用以下八种转义字符。这...转载 2019-01-25 10:26:55 · 14493 阅读 · 0 评论 -
"&#,&#x,\u"开头的unicode介绍
转载地址:https://blog.csdn.net/u013243986/article/details/75287078 最近在写爬虫时遇到"&#"或者 "&#x"开头的 编码,在浏览器是可以正常打开的,但是爬取下来时却,显示 &#x4e2d;&#x56fd;&#x519c;&#x4e1a;&#x94f6;&#...转载 2018-11-15 11:58:26 · 11340 阅读 · 0 评论 -
linux下c语言利用iconv函数实现utf-8转unicode
由于项目中需要转换原生unicode到ascii的功能,本来想的用的是linux或者windows自带的宽字节转成窄字节的函数,但由于本身使用了apr_iconv库,所以直接使用库函数来解决。 期间碰到了库函数使用一直出错的问题,一个是对应name的字符集库文件,需要设置一下APR_ICONV1_PATH,参考链接:https://www.cnblogs.com/chaohi...原创 2018-11-15 11:48:23 · 3346 阅读 · 0 评论 -
C语言切割多层字符串(strtok_r strtok使用方法)
转载地址:https://www.jb51.net/article/43744.htm1.strtok介绍 众所周知,strtok可以根据用户所提供的分割符(同时分隔符也可以为复数比如",。") 将一段字符串分割直到遇到"\0". 比如,分隔符=“,” 字符串=“Fred,John,Ann” 通过strtok 就可以把3个字符串 “Fred” “John” ...转载 2018-11-16 12:00:51 · 3930 阅读 · 0 评论 -
UCS-2、UCS-4、UTF-8、UTF-16、UTF-32介绍
转载地址:https://charlee.li/unicode-intro.html基本知识 (1) 字节和字符的区别 咦,字节和字符能有什么区别啊?不都是一样的吗?完全正确,但只是在古老的DOS时代。 当Unicode出现后,字节和字符就不一样了。 字节(octet)是一个八位的存储单元,取值范围一定是0~255。而字符(character,或者wor...转载 2018-11-16 11:33:46 · 1235 阅读 · 0 评论 -
C/C++中ASCII与Unicode字符串相互转换
转载地址:https://blog.csdn.net/wbq2018/article/details/88064311、ASCII to Unicode函数: wcstombs(VC6)、wcstombs_s实例://crt_wcstombs_s.c//This example converts a wide character//string to a multibyte ...转载 2018-11-12 20:16:20 · 6823 阅读 · 0 评论 -
不依赖任何系统API,用c语言实现gbk/utf8/unicode编码转换
转载地址:https://blog.csdn.net/bladeandmaster88/article/details/54837338汉字'我'Unicode编码是0x6211 01100010 00010001UTF8编码是 0xe68891 11100110 10001000 100010001n Unicode符号范围 (十六进...转载 2018-11-12 17:50:22 · 1714 阅读 · 0 评论 -
详解大端模式和小端模式
转载地址:https://www.cnblogs.com/little-white/p/3236548.html一、大端模式和小端模式的起源 关于大端小端名词的由来,有一个有趣的故事,来自于Jonathan Swift的《格利佛游记》:Lilliput和Blefuscu这两个强国在过去的36个月中一直在苦战。战争的原因:大家都知道,吃鸡蛋的时候,原始的方法是打破鸡蛋较大的一端,可以...转载 2018-11-13 13:29:32 · 200 阅读 · 0 评论 -
介绍三种将二进制字节字符转换为ASCII方法
转载地址:https://blog.csdn.net/rabbit729/article/details/3937528下面代码分别给出了三种将二进制字节字符转换为ASCII的方法/** @brief 该函数实现了将二进制字节数据转换为可打印ASCII码字符串* @param[in] pSrc 源数据指针* @param[in] nSrcLength 源数据长度* @param[...转载 2018-11-13 11:51:13 · 13629 阅读 · 0 评论 -
ASCII,Unicode和UTF-8终于找到一个能完全搞清楚的文章了
转载地址:https://blog.csdn.net/Deft_MKJing/article/details/79460485前言平时喜欢写东西,看博客,一直对编码有些懵,今天下午也不知道看到了什么,突然想了解下,就找到了这个文章,看完真的豁然开朗,这个必须留下来做纪念。http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_u...转载 2018-11-13 11:24:00 · 160 阅读 · 0 评论