Unicode全码及与Utf-8码查询

西子剑

于 2024-02-05 14:11:08 发布

阅读量559

点赞数 4

文章标签： c语言 c++ objective-c

本文链接：https://blog.csdn.net/sinat_32823305/article/details/136040294

版权

我们经常会碰到一些关于字符的问题，这里我做了一下整理。

获取全字符表：

#include<stdio.h>
#define BLOCK  80
int main()  //获取Unicode码表
{
    for(int lc=0x20; lc < 0xff*BLOCK; printf("%lc",lc++))
//        if((lc+1)%256==0)printf("\r\n%04X\r\n",lc)  //这行显示区块码，可注释掉
    
    ;return 0;    //为了方便注释，将上一行的分号移到了这一行的行首
}

获取字符的二进制码：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <wchar.h>
int main() //输出字符的utf8码及unicode编码
{
char str[]= "华夏文明";
wchar_t wstr[100];
int i,byte; //循环控制变量
    mbstowcs(wstr,str,strlen(str)+1);  //转换函数
    
for(byte = 0; str[byte]!= 0; byte ++){ //输出当前编码的16进制码
if( str[1]==0)printf("%6x",(str[byte]));
else printf("%x",(str[byte]));
if(str[byte+1] == 0) 
printf(" ");}
    
for(byte = 0; str[byte]!= 0; byte ++){
      if( str[1]==0)printf("                  ");
      for(I = 7 ; i>=0 ; i-- )//8位字符所以二进制数从0开始到8结束，共8位
        {
            printf("%d",(str[byte] >> i ) & 1);//输出第i位的值   
            if(i==0) printf(" "); 
        }
      }
 
printf("Utf-8");
printf(" %s",str);
printf("\r\n");
for(int i=0;i<wcslen(wstr);i++) //Unicode码宽字符
{
        printf("%6x",wstr[i]);
}
    
for(int j=0;j<wcslen(wstr);j++){
printf("         ");  // 8位对齐
//    printf("     ");      // 6位对齐
      for(i = 15 ; i>=0 ; i-- )//8位字符所以二进制数从0开始到8结束，共8位
      {
        if(i%8==7) printf(" "); // 8位对齐，i%8==7与i%6==5 效果差别大 
//        if(i%6==5) printf("   "); // 6位对齐 效果差别大
        printf("%d",(wstr[j] >> i ) & 1);//输出第ibit的值  
      }
}
printf(" Unicode");
    
return 0;
}

输出效果(ASCII字符)：