汉字 Unicode 编码范围 优化版本

  1. 准确的汉字 Unicode 编码范围参考网站 汉字 Unicode 编码范围
  2. 编码信息存在外部txt文本,程序动态读取解析
  3. 新建unicode.txt,把所有的编码信息保存进去
    在这里插入图片描述
    4.文件另存为,格式选择ANSI

在这里插入图片描述
4. 程序代码

void ParseUnicode(std::string file)
{
    std::vector<std::string> data;
    ReadFile(file, data);

    int startIndex = 0x4E00;
    //start 4e00 [0123456789ABCDEF]
    int size = data.size();
    for(int i = 0; i < size; i++){
        int strSize = data[i].size();

        for(int j=0;j<strSize;j+=2){
            std::string name = data[i].substr(j, 2);
            characterForms[name] = startIndex;
            startIndex++;
        }
    }
}

void ReadFile(std::string file, std::vector<std::string>& data)
{

 std::fstream fin;
 fin.open(file);
 if(!fin.is_open())
 {
     printf("cound open file %s\n", file.c_str());
     return;
 }

 std::string line;
 while(std::getline(fin, line))
 {
     data.push_back(line);
 }
 fin.close();
}

5.程序运行效果
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值