utf-8码点转unicode编码

最新推荐文章于 2024-05-25 17:41:43 发布

RGBMarco

最新推荐文章于 2024-05-25 17:41:43 发布

阅读量1.3k

点赞数

分类专栏：程序员的自我修养文章标签： unicode utf-8 编码

本文链接：https://blog.csdn.net/RGBMarco/article/details/80977578

版权

utf-8是unicode实现的一种方案,简单来说unicode规定了编码的字的数值,采用一一对应的方式使得所有文字都能找到对应的编码值,而utf-8引入了码点的概念,使得码点能够组合成对应的编码值,从而找到对应的文字,通过码点的范围,有组织的得到编码值

这里写图片描述

查看文字utf-8码点 unicode编码值

一般实现中都把21位码点位数及以上的编码值通过多个码元组合得到,这里直接使用uint32_t将其组合在一起

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <stdint.h>

#define IS_ONE2NINE(ch) ((ch >= '0') && (ch <= '9'))
#define IS_A2F(ch) ((ch >= 'A') && (ch <= 'F'))
#define IS_a2f(ch) ((ch >= 'a') && (ch <= 'f')) 
#define IS_ONE

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

RGBMarco

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
utf-8码点转unicode编码

utf-8是unicode实现的一种方案,简单来说unicode规定了编码的字的数值,采用一一对应的方式使得所有文字都能找到对应的编码值,而utf-8引入了码点的概念,使得码点能够组合成对应的编码值,从而找到对应的文字,通过码点的范围,有组织的得到编码值查看文字utf-8码点 unicode编码值一般实现中都把21位码点位数及以上的编码值通过多个码元组合得到,这里直接使用uint32_...
复制链接

扫一扫