4. Python3源码—字符串(bytes)对象

4.1. 字符串对象

字符串对象是“变长对象”。

4.1.1. Python中的创建

Python中字符串(bytes)对象创建最重要的方法为PyBytes_FromStringAndSize,如下Python语句最终会调用到PyBytes_FromStringAndSize:

图片描述

4.1.2. PyBytes_FromStringAndSize的C调用栈

词法解析,最终调到PyBytes_FromStringAndSize,调用顺序如下:

图片描述

4.1.3. PyBytes_FromStringAndSize源码

图片描述
图片描述

可以看到:

  • 字符串对象的C数据结构:

图片描述

  • 空串缓存:空串(nullstring)为同一个地址,第二次需要空串时,只是将计数加1,在_PyBytes_FromSize中实现空串缓存;
  • 字符缓冲池:字符(characters)为同一个地址,第二次需要该字符时,只是将计数加1,在PyBytes_FromStringAndSize中实现字符缓存;

4.2. 字符串对象的特性

支持tp_as_number、tp_as_sequence、tp_as_mapping这三种操作。

4.2.1. 数值操作

图片描述

4.2.2. 序列操作

图片描述
图片描述

因为没有实现PySequenceMethods中的设置方法,所以字符串不可变。

其中:

  • bytes_length

图片描述

  • bytes_concat

图片描述

多个字符串相加效率低于join,join只分配一次内存;

  • bytes_repeat

图片描述

效率要高于同个字符串相加;

  • bytes_item:暂时没有找到相应Python语句;
  • bytes_contains

图片描述

4.2.3. 关联操作

图片描述
图片描述

其中:

  • bytes_subscript

图片描述

test[1]会走bytes_subscript方法的index分支,test[0:5]会走slice分支;

4.2.4. to string

图片描述

4.2.5. hash

图片描述

4.2.6. 比较

图片描述

4.2.7. 内置方法

图片描述

4.3 参考

  • Python源码剖析

本文作者:whj0709
阅读原文
本文为云栖社区原创内容,未经允许不得转载。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值