一、字典
1.介绍
字典是“键值对”的无序可变序列,字典中的每个元素都是一个“键值对”,包含:“键对象”和“值对象”。可以通过“键对象”实现快速获取、删除、更新对应的“值对象”。
“键”是任意的不可变数据,比如:整数、浮点数、字符串、元组。但是:列表、字典、集合这些可变对象,不能作为“键”。并且“键”不可重复。
一个典型的字典的定义方式:
a = {'name':'gaoqi','age':18,'job':'programmer'}
2.创建
①通过{}、dict()创建
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> b = dict(name='gaoqi',age=18,job='programmer')
>>> a = dict([("name","gaoqi"),("age",18)])
>>> c = {} #空的字典对象
>>> d = dict() #空的字典对象
②通过zip()创建
>>> k = ['name','age','job']
>>> v = ['gaoqi',18,'techer']
>>> d = dict(zip(k,v)) #前为键,后为值
>>> d
{'name': 'gaoqi', 'age': 18, 'job': 'techer'}
③通过fromkeys 创建值为空的字典
>>> a = dict.fromkeys(['name','age','job']) #规定了键对象,值为空
>>> a
{'name': None, 'age': None, 'job': None} #None是值对象,意为空
3.访问
①通过[键] 获得“值”。若键不存在,则抛出异常
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> a['name']
'gaoqi'
>>> a['age']
18
>>> a['sex']
Traceback (most recent call last):
File "<pyshell#374>", line 1, in <module>
a['sex']
KeyError: 'sex'
②通过get()方法获得“值”
推荐使用。优点是:指定键不存在,返回None;也可以设定指定键不存在时默认返回的对象。推荐使用get()获取“值对象”。
>>> a.get('name')
'gaoqi'
>>> a.get('sex') #键对象不存在,返回空
>>> a.get('sex','一个男人') #键对象不存在,返回设定的值
'一个男人'
③列出所有的键值对、所有的键、所有的值
>>> a.items()
dict_items([('name', 'gaoqi'), ('age', 18), ('job', 'programmer')])
>>> a.keys()
dict_keys(['name', 'age', 'job'])
>>> a.values()
dict_values(['gaoqi', 18, 'programmer'])
④len() 键值对的个数
⑤检测一个“键”是否在字典中
>>> a = {"name":"gaoqi","age":18}
>>> "name" in a
True
4.添加、修改、删除
①给字典新增“键值对”
如果“键”已经存在,则覆盖旧的键值对;如果“键”不存在,则新增“键值对”。
>>>a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> a['address']='西三旗1 号院'
>>> a['age']=16
>>> a
{'name': 'gaoqi', 'age': 16, 'job': 'programmer', 'address': '西三旗1 号院'}
②update()
将新字典中所有键值对全部添加到旧字典对象上。如果key 有重复,则直接覆盖。
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> b = {'name':'gaoxixi','money':1000,'sex':'男的'}
>>> a.update(b)
>>> a
{'name': 'gaoxixi', 'age': 18, 'job': 'programmer', 'money': 1000, 'sex': '男的'}
③删除
(1)元素的删除,可以使用del()方法;
(2)clear()删除所有键值对;
(3)pop()删除指定键值对,并返回对应的“值对象”;
(4)popitem()随机删除和返回该键值对。popitem 弹出随机的项,因为字典并没有"最后的元素"或者其他有关顺序的概念。若想一个接一个地移除并处理项,这个方法就非常有效。
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> del(a['name'])
>>> a
{'age': 18, 'job': 'programmer'}
>>> b = a.pop('age')
>>> b
18
>>> a.clear()
>>> a
{}
>>> a = {'name':'gaoqi','age':18,'job':'programmer'}
>>> a.popitem()
('job', 'programmer')
>>> a
{'name': 'gaoqi', 'age': 18}
>>> a.popitem()
('age', 18)
>>> a
{'name': 'gaoqi'}
5.序列解包
序列解包可以用于元组、列表、字典。序列解包可以让我们方便的对多个变量赋值。
用于元组和列表:
>>> x,y,z=(20,30,10) #元组
>>> x
20
>>> y
30
>>> z
10
>>> (a,b,c)=(9,8,10)
>>> a
9
>>> [a,b,c]=[10,20,30] #列表
>>> a
10
>>> b
20
用于字典:
默认是对“键”进行操作; 如果需要对键值对操作,则需要使用items();如果需要对“值”进行操作,则需要使用values();
>>> s = {'name':'gaoqi','age':18,'job':'teacher'}
>>> name,age,job=s #默认对键进行操作
>>> name
name'
>>> name,age,job=s.items() #对键值对进行操作
>>> name
('name', 'gaoqi')
>>> name,age,job=s.values() #对值进行操作
>>> name
'gaoqi'
小练习
表格数据使用字典和列表存储,并实现访问
所有数据都可以用表格来表示。
r1 = {"name":"高小一","age":18,"salary":30000,"city":"北京"}
r2 = {"name":"高小二","age":19,"salary":20000,"city":"上海"}
r3 = {"name":"高小五","age":20,"salary":10000,"city":"深圳"}
tb = [r1,r2,r3]
#获得第二行的人的薪资
print(tb[1].get("salary"))
#打印表中所有的的薪资
for i in range(len(tb)): # i -->0,1,2
print(tb[i].get("salary"))
#打印表的所有数据
for i in range(len(tb)):
print(tb[i].get("name"),tb[i].get("age"),tb[i].get("salary"),tb[i].get("city"))
#带表头打印
r1={"姓名":"高小一","年龄":"18","薪资":"30000","城市":"北京"}
r2={"姓名":"高小二","年龄":"19","薪资":"20000","城市":"上海"}
r3={"姓名":"高小五","年龄":"20","薪资":"10000","城市":"深圳"}
biao=[r1,r2,r3]
for i in range(len(biao)+1):
if i<len(biao):
print(list(r1.keys())[i],end=" ")
else:
print(list(r1.keys())[i])
for i in range(len(biao)):
print(biao[i].get("姓名"),biao[i].get("年龄"),biao[i].get("薪资"),biao[i].get("城市"))
6.核心底层原理(重要)
字典对象的核心是散列表。散列表是一个稀疏数组(总是有空白元素的数组),数组的每个单元叫做bucket。每个bucket 有两部分:一个是键对象的引用,一个是值对象的引用。
由于,所有bucket 结构和大小一致,我们可以通过偏移量来读取指定bucket。
理解key和索引的对应原理。
Ⅰ.将一个键值对放进字典的底层过程
假设字典a 对象创建完后,数组长度为8:
我们要把”name”=”gaoqi”这个键值对放到字典对象a 中,首先第一步需要计算键”name”的散列值。Python 中可以通过hash()来计算。
>>> bin(hash("name"))
'-0b1010111101001110110101100100101'
由于数组长度为8,我们可以拿计算出的散列值的最右边3 位数字作为偏移量,即“101”,十进制是数字5。我们查看偏移量5,对应的bucket 是否为空。如果为空,则将键值对放进去。如果不为空,则依次取右边3 位作为偏移量,即“100”,十进制是数字4。再查看偏移量为4 的bucket 是否为空。直到找到为空的bucket 将键值对放进去。流程图如下:
python 会根据散列表的拥挤程度扩容。“扩容”指的是:创造更大的数组,将原有内容拷贝到新数组中。接近2/3 时,数组就会扩容。
Ⅱ.根据键查找“键值对”的底层过程
当我们调用a.get(“name”),就是根据键“name”查找到“键值对”,从而找到值对象“gaoqi”。
第一步,我们仍然要计算“name”对象的散列值;
和存储的底层流程算法一致,也是依次取散列值的不同位置的数字。假设数组长度为8,我们可以拿计算出的散列值的最右边3 位数字作为偏移量,即“101”,十进制是数字5。我们查看偏移量5,对应的bucket 是否为空。如果为空,则返回None。如果不为空,则将这个bucket 的键对象计算对应散列值,和我们的散列值进行比较,如果相等。则将对应“值对象”返回。如果不相等,则再依次取其他几位数字,重新计算偏移量。依次取完后,仍然没有找到。则返回None。流程图如下:
Ⅲ.总结
1. 键必须可散列
(1) 数字、字符串、元组,都是可散列的。
(2) 自定义对象需要支持下面三点:
①支持hash()函数
②支持通过__eq__()方法检测相等性。
③若a==b 为真,则hash(a)==hash(b)也为真。
2. 字典在内存中开销巨大,典型的空间换时间。
3. 键查询速度很快
4. 往字典里面添加新建可能导致扩容,导致散列表中键的次序变化。因此,不要在遍历字典的同时进行字典的修改。
二、集合
集合是无序可变,元素不能重复。实际上,集合底层是字典实现,集合的所有元素都是字典中的“键对象”,因此是不能重复的且唯一的。
1.创建和删除
①使用{}创建集合对象,并使用add()方法添加元素
格式与字典不同。
>>> a = {3,5,7}
>>> a
{3, 5, 7}
>>> a.add(9)
>>> a
{9, 3, 5, 7}
②使用set()
将列表、元组等可迭代对象转成集合。如果原来数据存在重复数据,则只保留一个。
>>> a = ['a','b','c','b']
>>> b = set(a)
>>> b
{'b', 'a', 'c'}
③remove()删除指定元素;clear()清空整个集合
>>> a = {10,20,30,40,50}
>>> a.remove(20)
>>> a
{10, 50, 30}
2.其他操作
Python 对集合也提供了并集、交集、差集等运算。
>>> a = {1,3,'sxt'}
>>> b = {'he','it','sxt'}
>>> a|b #并集
{1, 3, 'sxt', 'he', 'it'}
>>> a&b #交集
{'sxt'}
>>> a-b #差集
{1, 3}
>>> a.union(b) #并集
{1, 3, 'sxt', 'he', 'it'}
>>> a.intersection(b) #交集
{'sxt'}
>>> a.difference(b) #差集
{1, 3}
三、控制语句
1.选择结构
选择结构通过判断条件是否成立,来决定执行哪个分支。选择结构有多种形式,分为:单分支、双分支、多分支。
(1)单分支结构
if 语句单分支结构的语法形式如下:
if 条件表达式:
语句/语句块
其中:
1.条件表达式:可以是逻辑表达式、关系表达式、算术表达式等等。
2.语句/语句块:可以是一条语句,也可以是多条语句。多条语句,缩进必须对齐一致。
(2)条件表达式详解
在选择和循环结构中,条件表达式的值为False 的情况如下:
False、0、0.0、空值None、空序列对象(空列表、空元祖、空集合、空字典、空字符串)、空range 对象、空迭代对象。其他情况,均为True。
条件表达式中,不能有赋值操作符“=”
(3)双分支结构
双分支结构的语法格式如下:
if 条件表达式:
语句1/语句块1
else:
语句2/语句块2
(4)三元条件运算符
用来在某些简单双分支赋值情况。三元条件运算符语法格式如下:
条件为真时的值 if (条件表达式) else 条件为假时的值
num = input("请输入一个数字")
print( num if int(num)<10 else "数字太大")
(5)多分支结构
多分支选择结构的语法格式如下:
if 条件表达式1 :
语句1/语句块1
elif 条件表达式2:
语句2/语句块2
.
.
.
elif 条件表达式n :
语句n/语句块n
[else:
语句n+1/语句块n+1
]
多分支结构,几个分支之间是有逻辑关系的,不能随意颠倒顺序。
score = int(input("请输入学生的成绩:"))
grade = ''
if score < 60:
grade = '不及格'
elif score < 80:
grade = '及格'
elif score < 90:
grade = '良好'
else:
grade = '优秀'
print("分数是{0},等级是{1}".format(score,grade))
(6)选择结构嵌套
选择结构可以嵌套,使用时一定要注意控制好不同级别代码块的缩进量,因为缩进量决定了代码的从属关系。
if 表达式1:
语句块1
if 表达式2:
语句块2
else:
语句块3
else:
if 表达式4:
语句块4
小练习:输入一个分数。分数在0-100 之间。90 以上是A,80 以上是B,70 以上是C,60
以上是D。60 以下是E。
score = int(input("请输入一个在0-100 之间的数字:"))
grade = ""
if score>100 or score<0:
score = int(input("输入错误!请重新输入一个在0-100 之间的数字:"))
else:
if score>=90:
grade = "A"
elif score>=80:
grade = 'B'
elif score>=70:
grade = 'C'
elif score>=60:
grade = 'D'
else:
grade = 'E'
print("分数为{0},等级为{1}".format(score,grade))
代码更少的方法:
score = int(input("请输入一个在0-100 之间的数字:"))
degree = "ABCDE"
num = 0
if score>100 or score<0:
score = int(input("输入错误!请重新输入一个在0-100 之间的数字:"))
else:
num = score//10
if num<6:num=5
print("分数是{0},等级是{1}".format(score,degree[9-num]))
2.循环结构
(1)while循环
while 循环的语法格式如下:
while 条件表达式:
循环体语句
Tips:结构体中要条件条件改变的语句,以使循环结束,避免进入死循环。
操作1:利用while 循环打印从0-10 的数字。
num = 0
while num<=10:
print(num)
num += 1
操作2:利用while 循环,计算1-100 之间数字的累加和;计算1-100 之间偶数的累加和,计算1-100 之间奇数的累加和。
num = 0
sum_all = 0 #1-100 所有数的累加和
sum_even = 0 #1-100 偶数的累加和
sum_odd = 0 #1-100 奇数的累加和
while num<=100:
sum_all += num
if num%2==0:sum_even += num
else:sum_odd += num
num += 1 #迭代,改变条件表达式,使循环趋于结束
print("1-100 所有数的累加和",sum_all)
print("1-100 偶数的累加和",sum_even)
print("1-100 奇数的累加和",sum_odd)
(2)for循环
通常用于可迭代对象的遍历。for 循环的语法格式如下:
for 变量 in 可迭代对象:
循环体语句
可迭代对象:
(1)序列。包含:字符串、列表、元组
(2)字典
(3)迭代器对象(iterator)
(4)生成器函数(generator)
(5)文件对象
#字符
for x in "sxt001":
print(x)
#列表或元组
for x in (20,30,40):
print(x*3)
#字典
d = {'name':'gaoqi','age':18,'address':'西三旗001 号楼'}
for x in d: #遍历字典所有的key
print(x)
for x in d.keys():#遍历字典所有的key
print(x)
for x in d.values():#遍历字典所有的value
print(x)
for x in d.items():#遍历字典所有的"键值对"
print(x)
range 对象是一个迭代器对象,用来产生指定范围的数字序列,常用于for 循环中。
sum_all = 0 #1-100 所有数的累加和
sum_even = 0 #1-100 偶数的累加和
sum_odd = 0 #1-100 奇数的累加和
for num in range(101):
sum_all += num
if num%2==0:sum_even += num
else:sum_odd += num
print("1-100 累加总和{0},奇数和{1},偶数和{2}".format(sum_all,sum_odd,sum_even))
(3)嵌套循环
①操作1:打印如下图案
0 0 0 0 0
1 1 1 1 1
2 2 2 2 2
3 3 3 3 3
4 4 4 4 4
for x in range(5):
for y in range(5):
print(x,end="\t")
print()
②操作2:打印九九乘法表
for m in range(1,10):
for n in range(m):
a = m*(n+1)
print("{0}*{1}={2}".format(m,n+1,a),end="\t")
print()
③用列表和字典存储下表信息,并打印出表中工资高于15000 的数据
r1 = {"name":"高小一","age":18,"salary":30000,"city":"北京"}
r2 = {"name":"高小二","age":19,"salary":20000,"city":"上海"}
r3 = {"name":"高小三","age":20,"salary":10000,"city":"深圳"}
tb = [r1,r2,r3]
for x in tb:
if x.get("salary")>15000:
print(x)
(4)break和continue
break 语句可用于while 和for 循环,用来结束整个循环。当有嵌套循环时,break 语句只能跳出最近一层的循环。
continue 语句用于结束本次循环,继续下一次。多个循环嵌套时,continue 也是应用于最近的一层循环。
break结束的是一层结构的循环,而continue结束的是这一次循环,循环还会继续,只是不进行本次循环中continue后语句。
操作:要求输入员工的薪资,若薪资小于0 则重新输入。最后打印出录入员工的数量和薪资明细,以及平均薪资
#break
while True:
a = input("请输入一个字符(输入Q或q时退出):")
if a=='q' or a=='Q':
print("循环结束,退出")
break
else:
print(a)
#continue
empNum = 0
salarySum= 0
salarys = []
while True:
s = input("请输入员工的薪资(按Q 或q 结束):")
if s.upper()=='Q':
print("录入完成,退出")
break
if float(s)<0:
continue
empNum +=1
salarys.append(float(s))
salarySum += float(s)
print("员工数{0}".format(empNum))
print("录入薪资:",salarys)
print("平均薪资{0}".format(salarySum/empNum))
(5)else语句
while、for 循环可以附带一个else 语句(可选)。如果for、while 语句没有被break 语句结束,则会执行else 子句,否则不执行。语法格式如下:
while 条件表达式:
循环体
else:
语句块
或者:
for 变量in 可迭代对象:
循环体
else:
语句块
操作:员工一共4 人。录入这4 位员工的薪资。全部录入后,打印提示“您已经全部录入4 名员工的薪资”。最后,打印输出录入的薪资和平均薪资。
salarySum = 0
salarys = []
for i in range(4):
s = input("请输入一共4名员工的薪资(按Q或q中途结束):")
if s.upper()=='Q' or s.upper()=='q':
print("录入完成,退出")
break
if float(s)<0:
continue
salarys.append(float(s))
salarySum += float(s)
else:
print("您已经全部录入4 名员工的薪资")
print("录入薪资:",salarys)
print("平均薪资{0}".format(salarySum/4))
(6)循环代码的优化
1. 尽量减少循环内部不必要的计算
2. 嵌套循环中,尽量减少内层循环的计算,尽可能向外提。
3. 局部变量查询较快,尽量使用局部变量
#循环代码优化测试
import time
start = time.time()
for i in range(1000):
result = []
for m in range(10000):
result.append(i*1000+m*100)
end = time.time()
print("耗时:{0}".format((end-start)))
start2 = time.time()
for i in range(1000):
result = []
c = i*1000
for m in range(10000):
result.append(c+m*100)
end2 = time.time()
print("耗时:{0}".format((end2-start2)))
其他优化:
1. 连接多个字符串,使用join()而不使用+
2. 列表进行元素插入和删除,尽量在列表尾部操作
(7)zip()并行迭代
我们可以通过zip()函数对多个序列进行并行迭代,zip()函数在最短序列“用完”时就会停止。
names = ("高淇","高老二","高老三","高老四")
ages = (18,16,20,25)
jobs = ("老师","程序员","公务员")
for name,age,job in zip(names,ages,jobs):
print("{0}--{1}--{2}".format(name,age,job))
#不用zip也行
for i in range(3):
print("{0}--{1}--{2}".format(names[i],ages[i],jobs[i]))
3.推导式
推导式是从一个或者多个迭代器快速创建序列的一种方法。它可以将循环和条件判断结合,从而避免冗长的代码。推导式是典型的Python 风格,会使用它代表你已经超过Python 初学者的水平。
(1)列表推导式
列表推导式生成列表对象,语法如下:
[表达式 for item in 可迭代对象]
或者:[表达式 for item in 可迭代对象 if 条件判断]
#测试推导式
#列表推导式
y = [x*2 for x in range(1,5)]
print(y)
y = [x*2 for x in range(1,50) if x%5==0]
print(y)
cells = [(row,col) for row in range(1,10) for col in range(1,10)] #可以使用两个循环
for cell in cells:
print(cell)
(2)字典推导式
字典的推导式生成字典对象,格式如下:
{key_expression : value_expression for 表达式 in 可迭代对象}
#字典推导式
my_text = ' i love you, i love sxt, i love gaoqi'
char_count = {c:my_text.count(c) for c in my_text}
(3)集合推导式
集合推导式生成集合,和列表推导式的语法格式类似:
{表达式for item in 可迭代对象}
或者:{表达式for item in 可迭代对象if 条件判断}
#集合推导式
b = {x for x in range(1,100) if x%9==0}
print(b)
(4)生成器推导式
元组是没有推导式的,使用小括号的推导式生成的是一个生成器对象,一个生成器只能运行一次。第一次迭代可以得到数据,第二次迭代发现数据已经没有了。
#生成器推导式
gnt = (x for x in range(1,100) if x%9==0)
for x in gnt:
print(x,end=' ')
for x in gnt:
print(x,end=' ')
四、练习操作
1.绘制多个同心圆
import turtle
t = turtle.Pen()
my_color = ("red","green","blue","black","yellow")
t.width(4)
t.speed(0)
for x in range(10):
t.penup()
t.goto(0, -x*10)
t.pendown()
t.color(my_color[x%len(my_color)])
t.circle(x*10+10)
turtle.done()
2.绘制18*18 棋盘
#自己的想法
import turtle
width = 30
num = 18
length = width*num
t = turtle.Pen()
t.speed(10)
for x in range(num+1):
t.penup()
t.goto(-length/2, length/2-x*width)
t.pendown()
t.forward(length)
t.left(-90)
for x in range(num+1):
t.penup()
t.goto(-length/2+x*width, length/2)
t.pendown()
t.forward(length)
t.hideturtle()
turtle.done()
#答案
import turtle
width = 30
num = 18
x1 = [(-400,400),(-400+width*num,400)]
y1 = [(-400,400),(-400,400-width*num)]
t = turtle.Pen()
t.speed(10)
# t.goto(x1[0][0],x1[0][1])
# t.goto(x1[1][0],x1[1][1])
for i in range(0,19):
t.penup()
t.goto(x1[0][0],x1[0][1]-30*i)
t.pendown()
t.goto(x1[1][0],x1[1][1]-30*i)
for i in range(0,19):
t.penup()
t.goto(y1[0][0]+30*i,y1[0][1])
t.pendown()
t.goto(y1[1][0]+30*i,y1[1][1])
t.hideturtle() #隐藏画笔
turtle.done() #保证运行窗口不被自动关闭