详细地演示gb18030到unicode|utf8的转码过程(RUST语言)

编码的预备知识

首先看一下保存在文件中的GB18030编码:

可见GB18030也涵盖了日语的汉字。 B9 E2 A4 C8 E9 9C 2C B9 E2 D3 EB D3 B0 => 光と闇,光与影 这中间小于0x7F的byte只有一个2C,这个2C应该就是逗号了。GB18030的编码规律:

字节长度 码位空间 码位数目
单字节 0x00~0x80 129
双字节 字节1:0x81-0xFE 字节2: 0x40-0x7E,0x80-0xFE 23940
四字节 字节1:0x81-0xFE 字节2࿱
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Rust语言是一种系统级编程语言,它注重安全性、并发性和性能。以下是Rust语言的一些特点和特性: 1. 内存安全:Rust通过所有权系统、借用和生命周期来保证内存安全,避免了常见的内存错误,如空指针和数据竞争。 2. 并发性:Rust提供了轻量级的线程(称为任务)和消息传递并发模型,使得编写并发程序更加容易和安全。 3. 零成本抽象:Rust支持高级抽象,如泛型、模式匹配和trait(类似于接口),同时保证了运行时性能的可预测性。 4. 高性能:Rust的设计目标之一是提供与C/C++相媲美的性能,它通过零成本抽象和对内存布局的控制来实现高性能。 5. 跨平台:Rust可以在多个平台上进行开发,并且具有良好的跨平台支持。 R语言是一种专门用于数据分析和统计计算的编程语言。以下是R语言的一些特点和特性: 1. 数据处理和统计分析:R语言提供了丰富的数据处理和统计分析函数库,使得数据分析任务更加简单和高效。 2. 图形可视化:R语言具有强大的图形可视化能力,可以绘制各种类型的图表和图形,帮助用户更好地理解和展示数据。 3. 扩展性:R语言支持用户自定义函数和包的开发,可以根据具体需求扩展其功能。 4. 社区支持:R语言拥有庞大的用户社区,用户可以通过社区分享代码、解决问题和获取支持。 5. 整合性:R语言可以与其他编程语言(如Python和C++)进行整合,方便用户在不同领域的工作中使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值