02 线性数据结构

最新推荐文章于 2024-08-08 14:28:23 发布

荏苒化蝶

最新推荐文章于 2024-08-08 14:28:23 发布

阅读量294

点赞数

分类专栏： python学习文章标签： python 列表

本文链接：https://blog.csdn.net/weixin_44800915/article/details/109678876

版权

python学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1,内建常用数据类型

分类：

数值型
- int、ﬂoat、complex、bool
序列sequence
- 字符串str、字节序列bytes、bytearray
- 列表list、元组tuple
键值对
- 集合set、字典dict

1.1 数值型

int、ﬂoat、complex、bool都是class，1、5.0、2+3j都是对象即实例
int：python3的int就是长整型，且没有大小限制，受限于内存区域的大小
ﬂoat：由整数部分和小数部分组成。支持十进制和科学计数法表示。C的双精度型实现
complex：有实数和虚数部分组成，实数和虚数部分都是浮点数，3+4.2J
bool：int的子类，仅有2个实例True、False对应1和0，可以和整数直接运算

1.2 数值转换

int、ﬂoat、complex、bool也可以当做内建函数对数据进行类型转换
int(x) 返回一个整数
ﬂoat(x) 返回一个浮点数
complex(x)、complex(x,y) 返回一个复数
bool(x) 返回布尔值，前面讲过False等价的对象

1.3 整除

math模块的ﬂoor()、ceil()函数；内建函数int()、round()；运算符//

# 整除
print(3//2, 5//2, 7//2) 
print(-3//2, -5//2, -7//2) 
print(7//2, 7//-2, -7//2, -(7//2))

# int
print('int ------------') 
print(int(1.4), int(1.5), int(1.6)) print(int(-1.4), int(-1.5), int(-1.6))

# ceil floor
print('ceil floor ------------')
import math
print(math.floor(2.5), math.floor(-2.5)) print(math.ceil(2.5), math.ceil(-2.5))

# round
print('round ------------')
print(round(1.4), round(-1.4), round(-1.6), round(1.6))
print(round(2.4), round(-2.4), round(2.6), round(2.6)) 
print('round .5 ---------')
print(round(0.5), round(1.5), round(2.5), round(3.5)) print(round(-0.5), round(-1.5), round(-2.5), round(-3.5))

round()，四舍六入五取偶
math.ﬂoor()向下取整
math.ceil()向上取整
int() 取整数部分
// 整除且向下取整

1.4 常用数值处理函数

min()、max()
pow(x,y) 等于 x**y
math.sqrt() 等于 x ** 0.5
进制函数，返回值是字符串
- bin()、oct()、hex()
math模块
- math.pi π
- math.e 自如常数 -math模块中还有对数函数、三角函数等

type(123) # 返回的是类型int 
isinstance(456, int) 
isinstance(True, (str, int, bool))

type(1 + True)
type(1 + True + 2.0) # 什么类型

即使是强类型语言，也会有隐式类型转换。

2，线性数据结构

2.1 线性表

线性表（简称表），是一种抽象的数学概念，是一组元素的序列的抽象，它由有穷个元素组成（0 个或任意个）
顺序表：使用一大块连续的内存顺序存储表中的元素，这样实现的表称为顺序表，或称连续表在顺序表中，元素的关系使用顺序表的存储顺序自然地表示
链接表：在存储空间中将分散存储的元素链接起来，这种实现称为链接表，简称链表

列表如同地铁站排好的队伍，有序，可以插队、离队，可以索引。

链表如同操场上手拉手的小朋友，有序但排列随意。或者可以想象成一串带线的珠子，随意盘放在桌上。也可以离队、插队，也可以索引。

对比体会一下，这两种数据结构的增删改查。

2.2 列表list

一个排列整齐的队伍，Python采用顺序表实现
列表内的个体称作元素，由若干元素组成列表
元素可以是任意对象（数字、字符串、对象、列表等）
列表内元素有顺序，可以使用索引
线性的数据结构
使用 [ ] 表示
列表是可变的

列表是非常重要的数据结构，对其内存结构和操作方法必须烂熟于心。

2.2.1 初始化

list() -> new empty list
list(iterable) -> new list initialized from iterable's items
[]
列表不能一开始就定义大小

ls1 = []
ls2 = list()
ls3 = [2, 'ab', [3, 'abc'], (5, 30, 50)] # 列表是一个容器，元素可以是其它类型 
ls4 = list(range(5))#非常常用的构造方式，将一个可迭代对象转换为一个列表

2.2.2 索引

索引，也叫下标
正索引：从左至右，从0开始，为列表中每一个元素编号
- 如果列表有元素，索引范围[0, 长度-1]
负索引：从右至左，从-1开始
- 如果列表有元素，索引范围[-长度, -1]
正、负索引不可以超界，否则引发异常IndexError
为了理解方便，可以认为列表是从左至右排列的，左边是头部，右边是尾部，左边是下界，右边是上界
列表通过索引访问，list[index] ，index就是索引，使用中括号访问

使用索引定位访问元素的时间复杂度为O(1)，这是最快的方式，是列表最好的使用方式。

2.2.3 查询

index(value,[start,[stop]])
- 通过值value，从指定区间查找列表内的元素是否匹配
- 匹配第一个就立即返回索引
- 匹配不到，抛出异常ValueError
count(value)
- 返回列表中匹配value的次数
时间复杂度
- index和count方法都是O(n)
- 随着列表数据规模的增大，而效率下降
如何返回列表元素的个数？如何遍历？如何设计高效？
- len()

2.2.4 修改

索引定位元素，然后修改。注意索引不能超界

ls1 = [1,2,3,4] 
ls1[2] = 200

2.2.4 增加单个元素

append(object) -> None
- 列表尾部追加元素，返回None
- 返回None就意味着没有新的列表产生，就地修改
- 定位时间复杂度是O(1)
insert(index, object) -> None
- 在指定的索引index处插入元素object
- 返回None就意味着没有新的列表产生，就地修改
- 定位时间复杂度是O(1)
索引能超上下界吗？
- 超越上界，尾部追加
- 超越下界，头部追加

2.2.5 增加多个元素

extend(iteratable) -> None
- 将可迭代对象的元素追加进来，返回None
- 就地修改，本列表自身扩展
- -> list
  - 连接操作，将两个列表连接起来，产生新的列表，原列表不变
  - 本质上调用的是魔术方法__add__()方法
- -> list
  - 重复操作，将本列表元素重复n次，返回新的列表

ls1 = [1] * 5 
ls2 = [None] * 6 
ls3 = [1,2] * 3 
ls4 = [[1]] * 3

这个重复操作看似好用，如果原理掌握不好，但非常危险

y = [[1]] * 3 
print(y) # 结果是什么 
y[0] = 100
print(y) # 结果是什么 
y[1][0] = 200 
print(y) # 结果是什么

在Python中一切皆对象，而对象都是引用类型，可以理解为一个地址指针指向这个对象。但是，字面常量字符串、数值等表现却不像引用类型，暂时可以称为简单类型。而列表、元组、字典，包括以后学习的类和实例都可以认为是引用类型。你可以认为简单类型直接存在列表中，而引入类型只是把引用地址存在了列表中。

2.2.6 删除

remove(value) -> None
- 从左至右查找第一个匹配value的值，找到就移
- 除该元素，并返回None，否则ValueError
- 就地修改
- 效率？
pop([index]) -> item
- 不指定索引index，就从列表尾部弹出一个元素
- 指定索引index，就从索引处弹出一个元素，索引超界抛出IndexError错误
- 效率？指定索引的的时间复杂度？不指定索引呢？
clear() -> None
- 清除列表所有元素，剩下一个空列表

2.2.7 反转

reverse() -> None
- 将列表元素反转，返回None
- 就地修改

这个方法最好不用，可以倒着读取，都不要反转

2.2.8 排序

sort(key=None, reverse=False) -> None
- 对列表元素进行排序，就地修改，默认升序
- reverse为True，反转，降序
- key一个函数，指定key如何排序，lst.sort(key=function)

如果排序是必须的，那么排序。排序效率高吗

2.2.9 in成员操作

'a' in ['a', 'b', 'c'] 
[3,4] in [1, 2, 3, [3,4]]

for x in [1,2,3,4]: 
    pass

2.2.10 列表复制

a = list(range(4)) 
b = list(range(4)) 
print(a == b)
c = a
c[2] = 10
print(a)
print(a == b) # 还相等吗？ 
print(a == c) # 相等吗？

问题：

最终a 和 b相等吗？a和b分别存着什么元素
a 和 c 相等吗？为什么？ c = a 这一句有复制吗？

下面的程序a和b相等吗？

a = list(range(4)) 
b = a.copy() print(a == b)
a[2] = 10
print(a == b)

a = [1, [2, 3, 4], 5]
b = a.copy()
print(a == b)
a[2] = 10
print(a == b)
a[2] = b[2]
print(a == b)
a[1][1] = 100
print(a == b) # 还相等吗？ print(a)
print(b)

2.2.11 列表的内存模型和深浅拷贝

shadow copy
- 影子拷贝，也叫浅拷贝。遇到引用类型数据，仅仅复制一个引用而已
deep copy
- 深拷贝，往往会递归复制一定深度

一般情况下，大多数语言提供的默认复制行为都是浅拷贝。

import copy
a = [1, [2, 3], 4]
b = copy.deepcopy(a) 
print(a == b)
a[1][1] = 100
print(a == b) # 还相等吗？ 
print(a)
print(b)

Python内建数据类型，内部都实现了 == ，它的意思是内容比较

2.3 Python内存管理

面试题。

变量无须事先声明，也不需要指定类型，这是动态语言的特性
变量只是一个标识符，指向一个对象，而这个对象被创建在内存"堆"中
Python编程中一般无须关心变量的存亡，一般也不用关心内存的管理
python使用引用计数记录所有对象的引用数。当对象引用数变为0，它就可以被垃圾回收GC

计数增加：

赋值给其它变量就增加引用计数，例如 x=3; y=x; z=[x, 1]
实参传参，如foo(y)

计数减少：

函数运行结束时，局部变量就会被自动销毁，对象引用计数减少
变量被赋值给其它对象。例如 x=3; y=x; x=4

有关性能的时候，就需要考虑变量的引用问题，但是，到底该释放内存还是尽量不释放内存，看需求。

内存是宝贵的，因为它快。但再好的硬件资源，再多的机器，在高并发面前都嫌少。内存一定要合理利用。但是，数据搬到内存中不易，不要把大量数据好不容易搬到内存中，立刻就不要了。这非常没有效率。

2.3.1 引用计数的问题

引用计数是简单实现垃圾标记的办法。
引用计数可能出现循环引用，Python提供了gc模块，解决了这个问题

2.3.2 查看引用计数

import sys
x = [] 
print(sys.getrefcount(x)) print(sys.getrefcount([]))

y = x
print(sys.getrefcount(y), sys.getrefcount(x)) x = 5 # 注意字面常量
print(sys.getrefcount(y)) print(sys.getrefcount(x))

z = 5 
print(sys.getrefcount(x))

2.4 随机数

random模块

randint(a, b) 返回[a, b]之间的整数
randrange ([start,] stop [,step]) 从指定范围内，按指定基数递增的集合中获取一个随机数，基数缺省值为1。 random.randrange(1,7,2)
choice(seq) 从非空序列的元素中随机挑选一个元素，比如random.choice(range(10))，从0到9中随机挑选一个整数。random.choice([1,3,5,7])
3.6开始提供choices，一次从样本中随机选择几个，可重复选择，可以指定权重
random.shuﬄe(list) ->None 就地打乱列表元素
sample(population, k) 从样本空间或总体（序列或者集合类型）中随机取出k个不同的元素，返回一个新的列表
- random.sample(['a', 'b', 'c', 'd'], 2)
- random.sample(['a', 'a'], 2) 会返回什么结果
- 每次从样本空间采样，在这一次中不可以重复抽取同一个元素

import random
for i in range(10):
  print(random.randint(1, 5)) 
  print('-' * 30)
for i in range(10): 
    print(random.randrange(1, 5)) 
    print('-' * 30)
    
   x = [1, 2, 3, 4, 5] 
for i in range(10): 
    print(random.choice(x))
print('-' * 30)

# 观察下面的0和1的比例
for i in range(10):
    print(random.choices([0, 1], k=6))
print('-' * 30)
for i in range(10):
    print(random.choices([0, 1], [10, 1], k=6)) # 10比1权重
    
  x = [1, 2, 3, 4, 5]
# 采样
for i in range(5):
    print(random.sample(x, 5)) # k能不能是6？

2.5 元组tuple

一个有序的元素组成的集合
使用小括号 ( ) 表示
元组是不可变对象

2.5.1 初始化

tuple() -> empty tuple
tuple(iterable) -> tuple initialized from iterable's items

t1 = () # 空元组
t2 = (1,) # 必须有这个逗号 
t3 = (1,) * 5
t4 = (1, 2, 3)
t5 = 1, 'a'
t6 = (1, 2, 3, 1, 2, 3) 
t7 = tuple() # 空元组
t8 = tuple(range(5))
t9 = tuple([1,2,3])

2.5.2 索引

索引和列表规则一样，不可以超界

2.5.3 查询

方法和列表一样，时间复杂度也一样。index、count、len等 ####### 2.5.4 增删改元组元素的个数在初始化的时候已经定义好了，所以不能为元组增加元素、也不能从中删除元素、也不能修改元素的内容。

但是要注意下面这个例子

t1 = ([1]) * 3 
t1[1] = 100 # ?

# 注意下面的例子 
t2 = ([1],) * 3 
print(t2)
t2[1] = 100

t2[0][0] = 100 
print(t2)

上例说明t2是可变的吗？不是说元组不可变吗？到底什么不可变?

2.6 字符串str

一个个字符组成的有序的序列，是字符的集合
使用单引号、双引号、三引号引住的字符序列
字符串是不可变对象，是字面常量

Python3起，字符串都是Unicode类

2.6.1 初始化

s1 = 'string'
s2 = "string2"
s3 = '''this's a "String" '''
s4 = 'hello \n magedu.com'
s5 = r"hello \n magedu.com"
s6 = 'c:\windows\nt'
s7 = R"c:\windows\nt"
s8 = 'c:\windows\\nt'
name = 'tom'; age = 20 # python代码写在一行，使用分号隔开，不推荐 
s9 = f'{name}, {age}' # 3.6支持f前缀
sql = """select * from user where name='tom' """

r前缀：所有字符都是本来的意思，没有转义

f前缀：3.6开始，使用变量插值

2.6.2 索引

字符串是序列，支持下标访问。但不可变，不可以修改元素。

sql = "select * from user where name='tom'" 
print(sql[4]) # 字符串'c'
sql[4] = 'o' # 不可以

2.6.3 连接

+加号

将2个字符串连接起来
返回一个新的字符串 join方法
sep.join(iterable)
使用指定字符串作为分隔符，将可迭代对象中字- 符串使用这个分隔符拼接起来
可迭代对象必须是字符串
返回一个新的字符串

x = 'ab'
x = x + 'cd'

print(','.join(x)) 
print('\t'.join(x)) 
print('\n'.join(x)) 
print('-'.join(range(5))) # 可以吗

2.6.4 字符查找

ﬁnd(sub[, start[, end]]) -> int
- 在指定的区间[start, end)，从左至右，查找子串sub
- 找到返回正索引，没找到返回-1
rﬁnd(sub[, start[, end]]) -> int
- 在指定的区间[start, end)，从右至左，查找子串sub
- 找到返回正索引，没找到返回-1

s = 'magedu.edu' 
print(s.find('edu')) 
print(s.find('edu', 3)) 
print(s.find('edu', 4)) 
print(s.find('edu', 6, 9)) 
print(s.find('edu', 7, 20)) print(s.find('edu', 200))

s = 'magedu.edu' 
print(s.rfind('edu')) 
print(s.rfind('edu', 3)) 
print(s.rfind('edu', 4)) 
print(s.rfind('edu', 6, 9)) print(s.rfind('edu', 7, 20)) print(s.rfind('edu', 200))

这两个方法只是找字符串的方向不同，返回值一样。找到第一个满足要求的子串立即返回。特别注意返回值，找不到返回的是负数-1。

这两个方法效率高吗？要不要用？

这两个方法效率真不高，都是在字符串中遍历搜索，但是如果找子串工作必不可少，那么必须这么做，但是能少做就少做。

index(sub[, start[, end]]) -> int
- 在指定的区间[start, end)，从左至右，查找子串sub
- 找到返回正索引，没找到抛出异常ValueError
rindex(sub[, start[, end]]) -> int
- 在指定的区间[start, end)，从左至右，查找子串sub
- 找到返回正索引，没找到抛出异常ValueError

index方法和ﬁnd方法很像，不好的地方在于找不到抛异常。推荐使用ﬁnd方法

s = 'magedu.edu' 
print(s.index('edu')) 
print(s.index('edu', 3)) 
print(s.index('edu', 4)) 
#print(s.index('edu', 6, 9)) # 抛异常 print(s.index('edu', 7, 20)) #print(s.index('edu', 200)) # 抛异常

count(sub[, start[, end]]) -> int
- 在指定的区间[start, end)，从左至右，统计子串sub出现的次数

s = 'magedu.edu' 
print(s.count('edu')) 
print(s.count('edu', 4))

时间复杂度
- ﬁnd、index和count方法都是O(n)
- 随着字符串数据规模的增大，而效率下降
len(string)
- 返回字符串的长度，即字符的个数

2.6.5 分割

split(sep=None, maxsplit=-1) -> list of -strings
- 从左至右
- sep 指定分割字符串，缺省的情况下空白字符串作为分隔符
- maxsplit 指定分割的次数，-1 表示遍历整个字符串
- 立即返回列表
rsplit(sep=None, maxsplit=-1) -> list of strings
- 从右向左开始切，但是输出的字符串字符不会反
- sep 指定分割字符串，缺省的情况下空白字符串作为分隔符
- maxsplit 指定分割的次数，-1 表示遍历整个字符串
- 立即返回列表
splitlines([keepends]) -> list of strings - 按照行来切分字符串
- keepends 指的是是否保留行分隔符
- 行分隔符包括\n、\r\n、\r等

s = ','.join('abcd') 
print(s.split(',')) 
print(s.split()) 
print(s.split(',', 2))

s1 = '\na b  \tc\nd\n' #  注意下面3个切割的区别 
print(s1.split())
print(s1.split(' '))
print(s1.split('\n'))
print(s1.split('b'))

print(s1.splitlines())

partition(sep) -> (head, sep, tail)
- 从左至右，遇到分隔符就把字符串分割成两部分，返回头、分隔符、尾三部分的三元组
- 如果没有找到分隔符，就返回头、2个空元素的三元组
- sep 分割字符串，必须指定
rpartition(sep) -> (head, sep, tail)
- 从右至左，遇到分隔符就把字符串分割成两部分，返回头、分隔符、尾三部分的三元组
- 如果没有找到分隔符，就返回2个空元素和尾的三元组

s = ','.join('abcd') 
print(s.partition(',')) print(s.partition('.')) print(s.rpartition(',')) print(s.rpartition('.'))

2.6.6 替换

replace(old, new[, count]) -> str
- 字符串中找到匹配替换为新子串，返回新字符串
- count表示替换几次，不指定就是全部替换

s = ','.join('abcd')
print(s.replace(',', ' ')) print(s.replace(',', ' ', 2))

s1 = 'www.magedu.edu' 
print(s1.replace('w', 'a')) print(s1.replace('ww', 'a')) print(s1.replace('www', 'a'))

2.6.7 移除

- strip([chars]) -> str 
  - 在字符串两端去除指定的字符集chars中的所有字符
  - 如果chars没有指定，去除两端的空白字符 
- lstrip([chars]) -> str ，从左开始
- rstrip([chars]) -> str，从右开始

s = '\t\r\na b  c,d\ne\n\t' 
print(s.strip())
print('-' * 30) 
print(s.strip('\t\n')) 
print('-' * 30) 
print(s.strip('\t\ne\r'))

2.6.8 首位判断

endswith(suﬃx[, start[, end]]) -> bool
- 在指定的区间[start, end)，字符串是否是suﬃx结尾
startswith(preﬁx[, start[, end]]) -> bool
- 在指定的区间[start, end)，字符串是否是preﬁx开头

s = "www.magedu.edu" 
print(s.startswith('ww')) print(s.startswith('e', 7)) print(s.startswith('e', 10)) print(s.startswith('edu', 11)) print(s.endswith('edu'))

2.6.9 其他函数

upper()大写
lower()小写 swapcase() 交换大小写
isalnum() -> bool 是否是字母和数字组成
isalpha() 是否是字母
isdecimal() 是否只包含十进制数字
isdigit() 是否全部数字(0~9)
isidentiﬁer() 是不是字母和下划线开头，其他都是字母、数字、下划线
islower() 是否都是小写
isupper() 是否全部大写
isspace() 是否只包含空白字符

其他格式打印函数中文几乎不用，大家自行查看帮助

2.6.10 格式化

简单的使用+或者join也可以拼接字符串，但是需要先转换数据到字符串后才能拼接。

C风格printf-style

占位符：使用%和格式字符，例如%s、%d
修饰符：在占位符中还可以插入修饰符，例如%03d
format % values
- format是格式字符串，values是被格式的值
- 格式字符串和被格式的值之间使用%
- values只能是一个对象，可以是一个值，可以是一个元素个数和占位符数目相等的元组，也可以是一个字典

"I am %03d" % (20,)
'I like %s.' % 'Python'
"%3.2f%% 0x%x %#X" % (89.7654, 10, 256) # 宽度为3，小数点后2位
"I am %-5d" % (20,)
"%(host)s.%(domain)s" % {'domain':'magedu.com', 'host':'www'} # 靠名字对应

format函数

Python2.5之后，字符串类型提供了format函数，功能更加强大，鼓励使用。 "{} {xxx}".format(*args, **kwargs) -> str
args是可变的位置参数
kwargs是可变关键字参数，写作a=100
使用花括号作为占位符
{}表示按照顺序匹配位置参数，{n}表示取位置参数索引为n的值
{xxx}表示在关键字参数中搜索名称一致的
{{}} 表示打印花括号

# 位置对应 
"{}:{}".format('127.0.0.1', 8080

# 位置或关键字对应
"{server} {1}:{0}".format(8080, '127.0.0.1', server='Web Server Info: ')

# 访问元素 
"{0[0]}.{0[1]}".format(('magedu', 'com'))

# 进制
"{0:d} {0:b} {0:o} {0:x} {0:#X}".format(31)

# 浮点数
print("{}".format(3**0.5))       # 1.7320508075688772 print("{:f}".format(3**0.5))     # 1.732051，精度默认6 print("{:10f}".format(3**0.5))   # 右对齐，宽度10 
print("{:2}".format(102.231))    # 宽度为2数字 
print("{:2}".format(1))          # 宽度为2数字 
print("{:.2}".format(3**0.5))    # 1.7  2个数字 
print("{:.2f}".format(3**0.5))   # 1.73 小数点后2位 print("{:3.2f}".format(3**0.5))  # 1.73 宽度为3，小数点后2位 print("{:20.3f}".format(0.2745)) # 0.275 
print("{:3.3%}".format(1/3))     # 33.333%
# 注意宽度可以被撑破

# 对齐
print("{}*{}={}".format(5, 6, 5*6)) 
print("{}*{}={:2}".format(5, 6, 5*6)) 
print("{1}*{0}={2:3}".format(5, 6, 5*6)) 
print("{1}*{0}={2:0>3}".format(5, 6, 5*6)) 
print("{}*{}={:#<3}".format(4, 5, 20)) 
print("{:#^7}".format('*' * 3))

2.7 字节序列

Python3 引入两个新的类型bytes、bytearray。

bytes不可变字节序列；bytearray是可变字节数组。

2.7.1 编码与解码

编码：str => bytes，将字符串这个字符序列使用指定字符集encode编码为一个个字节组成的序列 bytes
解码：bytes或bytearray => str，将一个个字节按照某种指定的字符集解码为一个个字符串组成的字符串

print("abc".encdoe())        # 缺省为utf-8编码 
print("啊".encode('utf-8')) 
print("啊".encode('gbk')) 
print(b'abc'.decode('utf8')) 
print(b'\xb0\xa1'.decode('gbk')

2.7.2 ASII

ASCII（American Standard Code for Information Interchange，美国信息交换标准代码）是基于拉丁字母的一套单字节编码系统

熟记：

\x00 表中第一项，C语言中的字符串结束符
\t \x09 tab字符
\r\n \x0d\x0a
\x30~\x39 字符0~9，\x31 字符1
\x41 65 A
\x61 97 a

注意：这里的1指定是字符1，不是数字1

UTF-8、GBK都兼容了ASCII

'a\x09b\x0d\x0ac \x31\x41\x61' # 表示什么？ 'A' > 'a' # 谁大？

2.7.3 Bytes初始化

bytes() 空bytes
bytes(int) 指定字节的bytes，被0填充
bytes(iterable_of_ints) -> bytes [0,255]的int组成的可迭代对象
bytes(string, encoding[, errors]) -> bytes 等价于string.encode()
bytes(bytes_or_buﬀer) -> immutable copy of bytes_or_buﬀer 从一个字节序列或者buﬀer复制出一个新的不可变的bytes对象
使用b前缀定义
- 只允许基本ASCII使用字符形式b'abc9'
- 使用16进制表示b"\x41\x61"

bytes类型和str类型类似，都是不可变类型，操作方法类似。

print(b'abcd'[2]) # 返回int，指定是本字节对应的十进制数

2.7.4 bytearray初始化

bytearray() 空bytearray
bytearray(int) 指定字节的bytearray，被0填充
bytearray(iterable_of_ints) -> bytearray [0,255]的int组成的可迭代对象
bytearray(string, encoding[, errors]) -> bytearray 近似string.encode()，不过返回可变对象
bytearray(bytes_or_buﬀer) 从一个字节序列或者buﬀer复制出一个新的可变的bytearray对象

b前缀表示的是bytes，不是bytearray类型

由于bytearray类型是可变数组，所以，类似列表。

append(int) 尾部追加一个元素
insert(index, int) 在指定索引位置插入元素
extend(iterable_of_ints) 将一个可迭代的整数集合追加到当前bytearray
pop(index=-1) 从指定索引上移除元素，默认从尾部移除
remove(value) 找到第一个value移除，找不到抛ValueError异常
注意：上述方法若需要使用int类型，值在[0, 255]
clear() 清空bytearray
reverse() 翻转bytearray，就地修改

b = bytearray() 
b.append(97)
b.append(99) 
b.insert(1,98) 
b.extend([65,66,67]) 
b.remove(66)
b.pop()
b.reverse()
print(b) # 输出什么 
b.clear()

2.8 线性结构

线性结构特征：

可迭代 for ... in
有长度，通过len(x)获取，容器
通过整数下标可以访问元素。正索引、负索引
- 可以切片已经学习过的线性结构：list、tuple、str、bytes、bytearray

2.8.1 切片

sequence[start:stop] 
sequence[start:stop:step]

通过给定的索引区间获得线性结构的一部分数据
start、stop、step为整数，可以是正整数、负整数、零
start为0时，可以省略
stop为末尾时，可以省略
step为1时，可以省略
切片时，索引超过上界（右边界），就取到末尾；超过下界（左边界），取到开头

x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] print(x[:])
print(x[:-1]) #
print(x[0:])
print(x[3:])
print(x[3:-1]) #
print(x[9:])
print(x[:9])
print(x[9:-1])
print(x[:100])
print(x[-100:])
print(x[4:-2])
print(x[-4:-2]) 
print('0123456789'[-4:8]) print(b'0123456789'[-4:8]) print(bytearray(b'0123456789')[-10:5])

步长:

x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] print(x[::])
print(x[::2])
print(x[2:8:3])
print(x[:9:3])
print(x[1::3])
print(x[-10:8:2])

# 起止和方向
x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] print(x[-10:])
print(x[-5:6])
print(x[-5:-6])
print(x[6:5])
print(x[5:5])
print(x[1:9:-2])
print(x[::-2])
print(x[8::-2])
print(x[8:2:-2])
print(x[8:-10:2]) 
print(x[8:-10:-2]) 
print(x[-5:4:-1])
print(x[-5:5:-1])

在序列上使用切片[start:stop]，子区间索引范围[start, stop)，相当于从start开始指向stop的方向上获取数据

默认step为1，表示向右；步长为负数，表示向左

如果子区间方向和步长方向不一致，直接返回当前类型的"空对象"

如果子区间方向和步长方向一致，则从起点间隔步长取值

内建函数	函数签名	说明
id	id(object)	CPython中返回对象的内存地址

可以用来判断是不是同一个对象

# 使用id看地址，要注意地址回收复用问题
print(id([1,2,3]))
print(id([4,5,6,7]))
# 上下两句可能内存地址一样，但是上面那个[1,2,3]没有意义，因为它用完之后，引用计数为0了，没人
能再次访问到，释放了内存
# 如果2个存在在内存中的对象，地址一样一定是同一个对象

2.8.2 本质

x = [0, 1, 2]
y = x[:]
print(x, y) 
print(id(x), id(y)) 
x[0] = 100

print(x, y)
x = [[1]]
y = x[:]
print(x, y)
print(x == y)
print(id(x), id(y), x is y) 
x[0][0] = 100
print(x, y)
print(x == y)
print(x is y)
x[0] = 200
print(x == y) # ?
print(x, y)

上例可知，实际上切片后得到一个全新的对象。 [:] 或 [::] 相当于copy方法

2.8.3 切片赋值

切片操作写在了等号左边
被插入的可迭代对象写在等号右边

x = [0, 1, 2]
z = None
z = 1
z[:] = x # 可以吗

x = [0, 1, 2, 3, 4]
z = list()
z[:] = x
z[1:2] = 10 # 可以吗？ 
z[1:2] = (10,)
z[3:] = (20,)
z[1:] = (40, 50 ,60, 70) 
z[1:-1] = ()

x = [0, 1, 2, 3, 4]
y = []
y[:] = x
print(x == y)
print(id(x), id(y), x is y)

m = x # 这一句有什么用？y[:] = x有什么用？

m 和 x它们两个变量指向同一个对象。

y=[]、y[:]=x等价于 z=x[:]，都是创建x的副本。

切片赋值用作初始化相当于copy，还可以使用。如果用在替换、插入元素，看似语法比较简洁，但是由于列表是顺序表结构，将会引起数据的挪动，这非常影响性能，应当尽量避免使用。

2.9 作业

求100内奇数和
求100内斐波那契数列

荏苒化蝶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
02 线性数据结构

1,内建常用数据类型分类：数值型 int、ﬂoat、complex、bool 序列sequence 字符串str、字节序列bytes、bytearray 列表list、元组tuple 键值对集合set、字典dict 1.1 数值型int、ﬂoat、complex、bool都是class，1、5.0、2+3j都是对象即实例 int：python3的int就是长整型，且没有大小限制，受限于内存区域的大小 ﬂoat：由整数部分和小数部分组成。支持十进制和科学计数法表示。
复制链接

扫一扫

专栏目录