c语言字节类型(bytes),Python bytes类型及用法

Python bytes 类型用来表示一个字节串。“字节串“不是编程术语,是我自己“捏造”的一个词,用来和字符串相呼应。

bytes 是 Python 3.x 新增的类型,在 Python 2.x 中是不存在的。

字节串(bytes)和字符串(string)的对比:

字符串由若干个字符组成,以字符为单位进行操作;字节串由若干个字节组成,以字节为单位进行操作。

字节串和字符串除了操作的数据单元不同之外,它们支持的所有方法都基本相同。

字节串和字符串都是不可变序列,不能随意增加和删除数据。

bytes 只负责以字节序列的形式(二进制形式)来存储数据,至于这些数据到底表示什么内容(字符串、数字、图片、音频等),完全由程序的解析方式决定。如果采用合适的字符编码方式(字符集),字节串可以恢复成字符串;反之亦然,字符串也可以转换成字节串。

说白了,bytes 只是简单地记录内存中的原始数据,至于如何使用这些数据,bytes 并不在意,你想怎么使用就怎么使用,bytes 并不约束你的行为。

bytes 类型的数据非常适合在互联网上传输,可以用于网络通信编程;bytes 也可以用来存储图片、音频、视频等二进制格式的文件。

字符串和 bytes 存在着千丝万缕的联系,我们可以通过字符串来创建 bytes 对象,或者说将字符串转换成 bytes 对象。有以下三种方法可以达到这个目的:

如果字符串的内容都是 ASCII 字符,那么直接在字符串前面添加b前缀就可以转换成 bytes。

bytes 是一个类,调用它的构造方法,也就是 bytes(),可以将字符串按照指定的字符集转换成 bytes;如果不指定字符集,那么默认采用 UTF-8。

字符串本身有一个 encode() 方法,该方法专门用来将字符串按照指定的字符集转换成对应的字节串;如果不指定字符集,那么默认采用 UTF-8。

【实例】使用不同方式创建 bytes 对象:

#通过构造函数创建空 bytes

b1 = bytes()

#通过空字符串创建空 bytes

b2 = b''

#通过b前缀将字符串转换成 bytes

b3 = b'http://c.biancheng.net/python/'

print("b3: ", b3)

print(b3[3])

print(b3[7:22])

#为 bytes() 方法指定字符集

b4 = bytes('C语言中文网8岁了', encoding='UTF-8')

print("b4: ", b4)

#通过 encode() 方法将字符串转换成 bytes

b5 = "C语言中文网8岁了".encode('UTF-8')

print("b5: ", b5)

运行结果:

b3:  b'http://c.biancheng.net/python/'

112

b'c.biancheng.net'

b4:  b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'

b5:  b'C\xe8\xaf\xad\xe8\xa8\x80\xe4\xb8\xad\xe6\x96\x87\xe7\xbd\x918\xe5\xb2\x81\xe4\xba\x86'

从运行结果可以发现,对于非 ASCII 字符,print 输出的是它的字符编码值(十六进制形式),而不是字符本身。非 ASCII 字符一般占用两个字节以上的内存,而 bytes 是按照单个字节来处理数据的,所以不能一次处理多个字节。

如果你对进制不了解,请猛击:

#通过 decode() 方法将 bytes 转换成字符串

str1 = b5.decode('UTF-8')

print("str1: ", str1)

输出结果:

str1:  C语言中文网8岁了

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 C 语言中,可以通过以下代码实现 Python 中 `bytes(key, encoding='utf8')` 的功能: ```c #include <stdlib.h> #include <string.h> char* bytes(const char* key, const char* encoding) { size_t key_len = strlen(key); size_t encoding_len = strlen(encoding); // 计算需要分配的内存大小 size_t bytes_len = key_len + 1; // 计算字符串长度 if (strcmp(encoding, "utf8") == 0) { bytes_len *= sizeof(char); // 如果是 utf8 编码,每个字符占用 1 字节 } else if (strcmp(encoding, "utf16le") == 0) { bytes_len *= sizeof(short); // 如果是 utf16le 编码,每个字符占用 2 字节 } else if (strcmp(encoding, "utf16be") == 0) { bytes_len *= sizeof(short); // 如果是 utf16be 编码,每个字符占用 2 字节 } // 分配内存 char* bytes = (char*) malloc(bytes_len); // 拷贝字符串,并转换编码 if (strcmp(encoding, "utf8") == 0) { memcpy(bytes, key, key_len + 1); } else if (strcmp(encoding, "utf16le") == 0) { for (size_t i = 0; i < key_len; i++) { bytes[i * 2] = key[i]; // 将字符的低 8 位写入字节流的低 8 位 bytes[i * 2 + 1] = 0; // 将字符的高 8 位写入字节流的高 8 位(置零) } bytes[key_len * 2] = 0; // 字符串以 2 个字节的 0 结尾 bytes[key_len * 2 + 1] = 0; } else if (strcmp(encoding, "utf16be") == 0) { for (size_t i = 0; i < key_len; i++) { bytes[i * 2] = 0; // 将字符的高 8 位写入字节流的高 8 位(置零) bytes[i * 2 + 1] = key[i]; // 将字符的低 8 位写入字节流的低 8 位 } bytes[key_len * 2] = 0; // 字符串以 2 个字节的 0 结尾 bytes[key_len * 2 + 1] = 0; } return bytes; } ``` 这个函数接受两个参数,一个是要转换的字符串 `key`,另一个是目标编码 `encoding`。根据目标编码的不同,函数会分别计算需要分配的内存大小,并在分配内存后将字符串拷贝到新的内存中,并进行编码转换。最后返回转换后的字节数组

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值