phthon数据结构基础知识
一、列表
1. 创建:
# 使用[]创建
x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']
mix = [1, 'lsgo', 3.14, [1, 2, 3]] #列表可存放任何对象
empty = []
print(x, type(x))
# ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday'] <class 'list'>
# 使用range()函数创建
x = list(range(1,10,2))
print(x)
# [1, 3, 5, 7, 9]
# 使用推导式创建
x = [0]*5
# [0,0,0,0,0]
x = [i for i in range(10)]
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
C = [[0]*3 for i in range(4)] #二维列表
2. 添加:
list.append(obj),obj可以是任意对象,追加在列表末尾
list.extend(seq),在列表末尾追加另一个序列的值
list.insert(index, obj),在index位置插入obj对象
3. 删除:
list.remove(obj),删除第一个与obj匹配的对象
list.pop([index=-1]) ,移除列表中的值并返回第一个值,默认移除最后一个元素
del x[0:2] ,删除一个或多个对象
4. 访问
x[n1:n2:n3] #从n1开始到n2结束但不包括n2,以n3为递增间隔
x = [0,1,2,3,4,5,6,7]
x[1] #第二个元素 1
x[3:] #第四个元素到最后一个元素 3,4,5,6,7
x[:3] #第一个到第三个元素 0,1,2
x[1:7:2] # 1,3,5
list1 = [123, 456, 789, 213]
list2 = list1 #浅拷贝
list3 = list1[:] #深拷贝
print(list2) # [123, 456, 789, 213]
print(list3) # [123, 456, 789, 213]
list1.sort()
print(list2) # [123, 213, 456, 789]
print(list3) # [123, 456, 789, 213]
5. 操作符:
等号操作符:==
连接操作符 +
重复操作符 *
成员关系操作符 in、not in
list1 = [123, 456]
list2 = [456, 123]
list3 = [123, 456]
print(list1 == list2) # False
print(list1 == list3) # True
list4 = list1 + list2 # 需要创建新的list内存空间
print(list4) # [123, 456, 456, 123]
list5 = list3 * 3
print(list5) # [123, 456, 123, 456, 123, 456]
list3 *= 3
print(list3) # [123, 456, 123, 456, 123, 456]
print(123 in list3) # True
print(456 not in list3) # False
二、元组
1. 创建:
t1 = (1, 10.31, 'python') #元组创建后不能修改
x = (1,) # 一个元素时需要添加逗号,(1)只代表一个int类型的数字
x = ((1, 10.31, 'python'), ('data', 11))
2. 修改:修改元组中的可修改对象
t1 = (1, 2, 3, [4, 5, 6]) # t1[3]不可修改,但是t1[3]对象的元素可以修改
print(t1) # (1, 2, 3, [4, 5, 6])
t1[3][0] = 9
print(t1) # (1, 2, 3, [9, 5, 6])
3. 操作符
等号操作符:==
连接操作符 +
重复操作符 *
成员关系操作符 in、not in
4. 解压元组
t = (1, 10.31, 'python')
(a, b, c) = t #有几个元素左边括号定义几个变量
print(a, b, c)
# 1 10.31 python
t = (1, 10.31, ('OK', 'python'))
(a, b, (c, d)) = t
print(a, b, c, d)
t = 1, 2, 3, 4, 5
a, b, *rest, c = t # *通配符用来接收多个元素
print(a, b, c) # 1 2 5
print(rest) # [3, 4]
# 1 10.31 OK python
三、字符串
1. 创建:单引号和双引号都可以,三引号支持多行输出
t1 = 'i love Python!'
t2 = "I love Python!"
t3 = """I love
Python!"""
2. 转义字符:
\\ 反斜杠符号
\n 换行
\t 横向制表符(TAB)
\r 回车
print("C:\\Program Files\\Intel\\Wifi\\Help")
print(r'C:\Program Files\Intel\Wifi\Help') #在字符串前加r,则不需要使用转义字符
3. 字符串的切片与拼接
str1 = 'I Love LsgoGroup'
print(str1[:6]) # I Love
print(str1[5]) # e
print(str1[:6] + " 插入的字符串 " + str1[6:])
# I Love 插入的字符串 LsgoGroup
4. 常用方法
str = "phyton"
str.capitalize() #将第一个字符转换为大写Phython
str.lower() #转换字符串中所有大写字符为小写。
str.upper() #转换字符串中的小写字母为大写。
str.swapcase() #将字符串中大写转换为小写,小写转换为大写。
str.count("a", beg= 0,end=len(string)) # 统计目标字符串出现的次数,可以指定起始和结束范围
str.endswith(suffix, beg=0, end=len(string)) # 检查字符串是否以指定子字符串 suffix 结束,如果是,返回 True,否则返回 False。
str.startswith(substr, beg=0,end=len(string)) #检查字符串是否以指定子字符串 substr 开头,如果是,返回 True,否则返回 False
str.find(str, beg=0, end=len(string)) #检测 str 是否包含在字符串中,如果包含,返回开始的索引值,否则返回 -1。
str.rfind(str, beg=0,end=len(string)) #类似于 find() 函数,不过是从右边开始查找。
str.isnumeric() #如果字符串中只包含数字字符,则返回 True,否则返回 False。
str.lstrip([chars]) #删除字符串左边的空格或指定字符。
str.rstrip([chars]) #删除字符串末尾的空格或指定字符。
str.strip([chars]) #删除左右两边的空格或指定字符串
str.replace(old, new [, max]) # 将字符串中的old替换成new,如果max指定,则替换不超过max次。
str.split(str="", num) #不带参数默认是以空格为分隔符切片字符串,如果num参数有设置,则仅分隔num个子字符串,返回切片后的子字符串拼接的列表。
4. 字符串格式化
格式化函数:
str8 = "{0} Love {1}".format('I', 'Lsgogroup') # 位置参数
print(str8) # I Love Lsgogroup
str8 = "{a} Love {b}".format(a='I', b='Lsgogroup') # 关键字参数
print(str8) # I Love Lsgogroup
str8 = "{0} Love {b}".format('I', b='Lsgogroup') # 位置参数要在关键字参数之前
print(str8) # I Love Lsgogroup
str8 = '{0:.2f}{1}'.format(27.658, 'GB') # 保留小数点后两位
print(str8) # 27.66GB
格式化符号:
print('%c' % 97) # a %c为ascll字符
print('%c %c %c' % (97, 98, 99)) # a b c
print('%d + %d = %d' % (4, 5, 9)) # 4 + 5 = 9 %d为数字
print("我叫 %s 今年 %d 岁!" % ('小明', 10)) # 我叫 小明 今年 10 岁! %s为字符串
print('%o' % 10) # 12 %o为八进制
print('%x' % 10) # a %x为十六进制
print('%X' % 10) # A %X为十六进制
print('%f' % 27.658) # 27.658000 %f为浮点数
print('%e' % 27.658) # 2.765800e+01
print('%E' % 27.658) # 2.765800E+01
print('%g' % 27.658) # 27.658 %g为根据值的大小决定使用%f或%e
text = "I am %d years old." % 22
print("I said: %s." % text) # I said: I am 22 years old..
print("I said: %r." % text) # I said: 'I am 22 years old.' %r为格式化字符串
格式化符号辅助指令:
m.n m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)
- 用作左对齐
+ 在正数前面显示加号( + )
# 在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0 显示的数字前面填充'0'而不是默认的空格
print('%5.1f' % 27.658) # ' 27.7'
print('%.2e' % 27.658) # 2.77e+01
print('%10d' % 10) # ' 10'
print('%-10d' % 10) # '10 '
print('%+d' % 10) # +10
print('%#o' % 10) # 0o12
print('%#x' % 108) # 0x6c
print('%010d' % 5) # 0000000005
四、字典
字典的关键字是不可变类型,通常为字符串或数字。并且字典无序。
不可变数据类型:整型、字符串、元组
可变数据类型:列表、集合、字典
1. 创建:
dic = {'李宁': '一切皆有可能', '耐克': 'Just do it', '阿迪达斯': 'Impossible is nothing'}
dict() #创建一个空的字典。
dic1 = dict([('apple', 4139), ('peach', 4127), ('cherry', 4098)])
print(dic1) # {'cherry': 4098, 'apple': 4139, 'peach': 4127}
dic = dict(name='Tom', age=10) #这种情况下,键只能为字符串类型
print(dic) # {'name': 'Tom', 'age': 10}
2. 添加:
dic = dict()
dic['a'] = 1
dic['b'] = 2
3. 字典内置方法
dict.fromkeys(seq[, value]) #用于创建一个新字典,以序列 seq 中元素做字典的键,value 为字典所有键对应的初始值。
seq = ('name', 'age', 'sex')
dic1 = dict.fromkeys(seq)
print(dic1)
# {'name': None, 'age': None, 'sex': None}
dic2 = dict.fromkeys(seq, 10)
print(dic2)
# {'name': 10, 'age': 10, 'sex': 10}
dic3 = dict.fromkeys(seq, ('小马', '8', '男'))
print(dic3)
# {'name': ('小马', '8', '男'), 'age': ('小马', '8', '男'), 'sex': ('小马', '8', '男')}
dict.keys() #返回一个可迭代对象,可以使用 list() 来转换为列表,列表为字典中的所有键。
dict.values() #返回一个迭代器,可以使用 list() 来转换为列表,列表为字典中的所有值。
lst = list(dic.keys()) # 转换为列表
lst = list(dic.values())
dict.items() #以列表返回可遍历的 (键, 值) 元组数组。
dic = {'Name': 'Lsgogroup', 'Age': 7}
print(dic.items())
# dict_items([('Name', 'Lsgogroup'), ('Age', 7)])
print(tuple(dic.items()))
# (('Name', 'Lsgogroup'), ('Age', 7))
print(list(dic.items()))
# [('Name', 'Lsgogroup'), ('Age', 7)]
dict.get(key, default=None) #返回指定键的值,如果值不在字典中返回默认值。
dic = {'Name': 'Lsgogroup', 'Age': 27}
print("Age 值为 : %s" % dic.get('Age')) # Age 值为 : 27
dict.setdefault(key, default=None) #和get()方法 类似, 如果键不存在于字典中,将会添加键并将值设为默认值。
dic = {'Name': 'Lsgogroup', 'Age': 7}
print("Age 键的值为 : %s" % dic.setdefault('Age', None)) # Age 键的值为 : 7
dic = {'Name': 'Lsgogroup', 'Age': 7}
# in 检测键 Age 是否存在
if 'Age' in dic:
print("键 Age 存在")
else:
print("键 Age 不存在")
dict.pop(key[,default]) #删除字典给定键 key 所对应的值,返回值为被删除的值。key 值必须给出。若key不存在,则返回 default 值。
del dict[key] #删除字典给定键 key 所对应的值。
dict.popitem() #随机返回并删除字典中的一对键和值,如果字典已经为空,却调用了此方法,就报出KeyError异常。
dict.clear() #用于删除字典内所有元素。
dict.copy() #返回一个字典的浅复制。浅拷贝父对象(一级目录),子对象(二级目录)不拷贝,还是引用
dict.update(dict2) #把字典参数 dict2 的 key:value对 更新到字典 dict 里。
五、集合
集合元素不能重复,集合元素为不可变类型,且元素无序
1. 创建:
basket = set() #创建空集合
num = {1, 2, 3, 4}
b = set(("Google", "Lsgogroup", "Taobao", "Taobao")) #重复元素自动过滤
2. 添加:
basket.add('apple')
#去掉列表中重复的元素
lst = [0, 1, 2, 3, 4, 5, 5, 3, 1]
a = set(lst)
print(list(a)) # [0, 1, 2, 3, 4, 5]
3. 访问:
#可以使用len()內建函数得到集合的大小。
s = set(['Google', 'Baidu', 'Taobao'])
print(len(s)) # 3
#可以使用for把集合中的数据一个个读取出来。
s = set(['Google', 'Baidu', 'Taobao'])
for item in s:
print(item)
#可以通过in或not in判断一个元素是否在集合中已经存在
s = set(['Google', 'Baidu', 'Taobao'])
print('Taobao' in s) # True
print('Facebook' not in s) # True
4. 集合内置方法
set.add(elmnt) #用于给集合添加元素,如果添加的元素在集合中已存在,则不执行任何操作。
set.update(set) #用于修改当前集合,可以添加新的元素或集合到当前集合中,如果添加的元素在集合中已存在,则该元素只会出现一次,重复的会忽略。
x = {"apple", "banana", "cherry"}
y = {"google", "baidu", "apple"}
x.update(y)
print(x)
# {'cherry', 'banana', 'apple', 'google', 'baidu'}
y.update(["lsgo", "dreamtech"])
print(y)
# {'lsgo', 'baidu', 'dreamtech', 'apple', 'google'}
set.remove(item) #用于移除集合中的指定元素。如果元素不存在,则会发生错误。
fruits = {"apple", "banana", "cherry"}
fruits.remove("banana")
set.discard(value) #用于移除指定的集合元素。remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。
set.pop() #用于随机移除一个元素。
#集合交集
a = set('abracadabra')
b = set('alacazam')
print(a) # {'r', 'a', 'c', 'b', 'd'}
print(b) # {'c', 'a', 'l', 'm', 'z'}
c = a.intersection(b) #返回两个集合的交集
c = a & b #返回两个集合的交集
a.intersection_update(b) #交集,在原始的集合上移除不重叠的元素。
#并集
c = a.union(b) #返回两个集合的并集。
set1 | set2 #返回两个集合的并集。
#差集
c = a.difference(b) #返回集合的差集。
a - b #返回集合的差集。
a.difference_update(b) #集合的差集,直接在原来的集合中移除元素,没有返回值。
#异或
a = set('abracadabra')
b = set('alacazam')
print(a) # {'r', 'a', 'c', 'b', 'd'}
print(b) # {'c', 'a', 'l', 'm', 'z'}
c = a.symmetric_difference(b)
print(c) # {'m', 'r', 'l', 'b', 'z', 'd'}
print(a ^ b) # {'m', 'r', 'l', 'b', 'z', 'd'}
print(a) # {'r', 'd', 'c', 'a', 'b'}
a.symmetric_difference_update(b)
print(a) # {'r', 'b', 'm', 'l', 'z', 'd'}
#包含
x = {"a", "b", "c"}
y = {"f", "e", "d", "c", "b", "a"}
z = x.issubset(y) #判断集合是不是被其他集合包含,如果是则返回 True,否则返回 False。
print(x <= y) # True
x = {"f", "e", "d", "c", "b", "a"}
y = {"a", "b", "c"}
z = x.issuperset(y) #用于判断集合是不是包含其他集合,如果是则返回 True,否则返回 False。
print(z) # True
print(x >= y) # True
x = {"f", "e", "d", "c", "b"}
y = {"a", "b", "c"}
z = x.isdisjoint(y) #用于判断两个集合是不是不相交,如果是返回 True,否则返回 False。
4. 集合转换其他类型
se = set(range(4))
li = list(se)
tu = tuple(se)
a = frozenset(range(10)) # 生成一个新的不可变集合,不能添加、删除元素
六、序列
在 Python 中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持一些通用的操作,但比较特殊的是,集合和字典不支持索引、切片、相加和相乘操作。
list(sub) #把一个可迭代对象转换为列表。
tuple(sub) #把一个可迭代对象转换为元组。
str(obj) #把obj对象转换为字符串
len(s) #返回对象(字符、列表、元组等)长度或元素个数。
max(sub) #返回序列或者参数集合中的最大值
min(sub) #返回序列或参数集合中的最小值
sum(iterable[, start=0]) #返回序列iterable与可选参数start的总和。
print(sum([1, 3, 5, 7, 9])) # 25
print(sum([1, 3, 5, 7, 9], 10)) # 35
sorted(iterable, key=None, reverse=False) #对所有可迭代的对象进行排序操作。
iterable -- #可迭代对象。
key -- #主要是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。
reverse -- #排序规则,reverse = True 降序 , reverse = False 升序(默认)。
#返回重新排序的列表。
x = [-8, 99, 3, 7, 83]
print(sorted(x)) # [-8, 3, 7, 83, 99]
print(sorted(x, reverse=True)) # [99, 83, 7, 3, -8]
t = ({"age": 20, "name": "a"}, {"age": 25, "name": "b"}, {"age": 10, "name": "c"})
x = sorted(t, key=lambda a: a["age"])
print(x)
# [{'age': 10, 'name': 'c'}, {'age': 20, 'name': 'a'}, {'age': 25, 'name': 'b'}]
reversed(seq) # 函数返回一个反转的迭代器。
enumerate(sequence, [start=0]) # 用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标
seasons = ['Spring', 'Summer', 'Fall', 'Winter']
a = list(enumerate(seasons))
print(a)
# [(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]
for i, element in a:
print('{0},{1}'.format(i, element))
# 0,Spring
# 1,Summer
# 2,Fall
# 3,Winter