Python相关面试题总结-2022

Python相关面试题总结

一、数据结构相关话题

问题1:如何在列表、字典、集合中根据条件筛选数据?

实际案例

  1. 过滤掉列表[1,5,-3,-2,6,0,9,…]中的负数
  2. 筛出字典{“LeiJun”:45,“Lucky”:20,“XiXin”:92,…}中值高于90的项
  3. 筛出集合{77,80,33,20,…}中能被3整除的元素
简单的解决方法——过滤列表(for循环)
#简单方法:迭代
data=[1,5,-3,-2,6,0,9]
res=[]
for x in data:
	if x>=0:
		res.append(x)
print(res)
高阶解决方案:
  1. 列表
    filter函数 - filter(lambda x:x >=0,data)
    列表解析 - [x for x in data if x>=0]
  2. 字典
    字典解析 [k:v for k,v in d.iteritems() if v>90]
  3. 集合
    集合解析 {x for x in s if x%3 == 0 }

⚠️:生成随机数列

python2.x  --> xrange()
python3.x --> range()

实现方法——列表

from random import randint
data = [randint(-10,10) for _ in xrange(10)]    
#生成一个随机的列表

#第一种方法:filter
filter(lambda x:x>0,data)

#第二种方法:列表解析
[x for x in data if x>=0]

#比较两种方法的时间,看哪种方法更快?
timeit filter(lambda x:x>0,data)   #909ns
timeit [x for x in data if x>=0]   #455ns

#结论:第二种方法更快;但这两种方案都远快于迭代的方案
  • 实现方法——字典
#生成字典
d = [x:randint(60,100) for x in xrange(1,21)]
{k:v for k,v in d.iteritems() if v >90}
  • 实现方法——集合
#生成集合
data = [randint(-10,10) for _ in xrange(10)] 
s = set(data)     #集合
{x for x in s if x % 3 == 0 }

问题2: 如何为元组中的每个元素命名,提高程序可读性?

实际案例
学生信息系统中数据为固定格式:
(姓名,年龄,性别,电话)
学生数量很大,为了减少存储开销,对每个学生信息用元组表示:

('Jim',16,'male','18211112222')
('LeiJun',17,'male','18211112223')
('Lucky',18,'female','18211112224')

访问时,我们使用索引(index)访问,大量索引降低程序可读性。如何解决这个问题?
解决方案:
方案1:定义类似与其他语言的枚举类型,也就是定义一系列数值常量
方案2: 使用标准库中collections.namedtuple替代内置tuple

  • 一般解决方法

NAME,AGE,SEX,EMAIL = xrange(4)
student =('Jim',16,'male','18211112222')
#name
print(student[NAME])

#age
print(student[AGE])

#sex
print(student[SEX])

  • 高阶解决方案

from collections import nametuple
Student = nametuple('Student',['name','age','sex','telephone'])

s =Student('Jim',16,'male','18211112222')

s2 =Student(name='Jim',age=16,sex='male',telephone='18211112222')

#引用方式:
s.name
s.age
s.sex

#判断s是否是内置类型的一个子类
isinstance(s,tuple)  #返回True

问题3:如何统计序列中元素的出现频度?

实际案例

1某随机序列[12,2,3,4,5,5,7,…]中找到出现次数最高的3个元素,它们出现次数是多少?

2 对某英文文章的单词,进行词频统计,找到出现次数最高的10个单词,它们出现次数是多少?
解决方案:
使用collections.Counter对象
将序列传入Counter的构造器,得到Counter对象是元素频度的字典
Counter.most_common(n)方法得到频度最高的n个元素的列表

from random import randint
data = [randint(0,20) for _ in xrange(30)]

c = dict.fromkeys(data,0)
for x in data:
	c[x]+=1

from random import randint
from collections import Counter
data = [randint(0,20) for _ in xrange(30)]
c2 = Counter(data)
c2.most_common(3)
#词频统计
import re
from collections import Counter
txt=open('CodingStyle.txt').read()
r = re.split('\W+',txt) #分割,使用正则表达式进行非字母格式进行分割
#正则"\W",匹配非字母、数字、下划线。等价于 '[^A-Za-z0-9_]'
c3 = Counter(r) #统计词频
c3.most_common(10)

问题4:如何根据字典中值的大小,对字典中的项排序

实际案例

某班英语成绩以字典形式存储为:
{‘LieJun’:78,‘Jim’:88,‘Lucky’:92,…}
根据成绩高低,计算学生排名
解决方案
使用内置函数sorted
1 利用zip将字典数据转化元组
2 传递sorted函数的key参数

sorted([9,1,2,8,5])
from random import randint
{x:randint(60,100) for x in 'xyzabc'}
d={x:randint(60,100) for x in 'xyzabc'}

sorted(d)  #按照键排序
iter(d)   #字典的可迭代对象
list(iter(d))
(97,'a') >(69,'b')  #返回True(元组的大小比较方法,先比较第一个元素)

d.keys()   #d的键
d.values()  #d的值
zip(d.values,d.keys())  #如果keys和values很多时,则浪费空间,可以用迭代版本
zip(d.itervalues(),d.iterkeys())
sorted(zip(d.itervalues(),d.iterkeys()))  #第一种方法:使用zip
d.items()
sorted(d.items(),key = lambda x:x[1])   #第二种方法:以第2个值作为排序的key

在这里插入图片描述

问题5: 如何快速找到多个字典中的公共键(key)?

实际案例

西班牙足球甲级联赛,每轮球员进球统计:
第一轮:{‘a’:1,‘b’:2,‘c’:3,…}
第二轮:{‘a’:2,‘c’:1,‘d’:3,‘e’:1}
第三轮:{‘a’:1,‘d’:2,‘f’:1}
统计出前N轮,每场比赛都有进球的球员。

解决方案:利用集合(set)的交集操作
Step1:使用字典的viewkeys()方法,得到一个字典keys的集合
Step2:使用map函数,得到所有字典的keys的集合
Step3:使用reduce函数,取所有字典的keys的集合的交集

from random import randint,sample
a = "abcdefg"
sample(a,3)  #随机在a中取三个值
sam=sample(a,randit(3,6))  #随机在a中取3-6个值
s1={x:randint(1,4) for x in sam}
s2={x:randint(1,4) for x in sam}
s3={x:randint(1,4) for x in sam}

#第一种方法:
res=[]
for k in s1:
	if k in s2 and k in s3:
		res.append(k)

#第二种方法:
s1.viewkeys()&s2.viewkeys()&s3.viewkeys()

#第三种方法:
map(dict.viewkeys,[s1,s2,s3])
reduce(lambda a,b:a&b,map(dict.viewkeys,[s1,s2,s3]))  
#两个两个比较,最后得出并集的最终集合;

问题6:如何让字典保持有序?

实际案例

某编程竞赛系统,对参赛选手编程解题进行计时,选手完成题目后,把该选手解题用事记录到字典中,以便赛后按选手名查询成绩
(答题用时越短,成绩越优)
{‘LeiJun’:(2,43),‘Jim’:(3,50),‘Lucky’:(1,30),…}

解决方案:使用collections.OrderedDict
以OrderedDict替代内置字典Dict,依次将选手成绩存入OrderedDict

d={}
d["Jim"]=(1,35)
d["Leo"]=(2,37)
d["Bob"]=(3,40)
for k in d:print k


from collections import OrderedDict
d=OrderedDict()  #按照插入顺序存储,使字典有序
d["Jim"]=(1,35)
d["Leo"]=(2,37)
d["Bob"]=(3,40)
for k in d:print k
from time import time
from random import randint
from collections import OrderDict

d=OrderedDict() 
players=list("ABCDEFGH")
start=time()
for i in xrange(8):
	raw_input()#等待一个用户输入,程序将阻塞,但是时间还是在往前走的;相当于产生了一个选手,他答题完毕;循环实现。
	p=players.pop(randint(0,7-i))#随机位置减少一个人
	end=time()
	print(i+1,p,end-start)
	d[p]=(i+1,end-start)
print
print '-'*20

for k in d:
	print(k,d[k])

问题7:如何实现用户的历史记录功能(最多n条)?

实际案例

很多应用程序都有浏览用户的历史记录的功能,例如:
浏览器可以查看最近访问过的网页。
视频播放器可以查看最近播放过视频文件
Shell可以查看用户输入过的命令

现在我们制作了一个简单的猜数字的小游戏,添加历史记录功能,显示用户最近猜过的数字,如何实现?
解决方案:使用容量为n的队列存储历史记录
使用标准看collections中的deque,它是一个双端循环队列
程序退出前可以使用pickle将队列对象存入文件,再次运行程序时将其导入

#猜数字的小游戏
from random import randint
N=randint(0100)
def guess(k):
	if k==N:
		print('right')
		return True
	if k<N:
		print('%s is less-than N' % k)
	else:
		print('%s is greater-than N' % k)
	return False
while True:
	line=raw_input("please input a number:")
	if line.isdigit():
		k=int(line)
		if guess(k):
			break
#修改猜数字的小游戏
from random import randint
from collections import deque
N=randint(0100)
history = deque([],5)
def guess(k):
	if k==N:
		print('right')
		return True
	if k<N:
		print('%s is less-than N' % k)
	else:
		print('%s is greater-than N' % k)
	return False
while True:
	line=raw_input("please input a number:")
	if line.isdigit():
		k=int(line)
		history.append(k)
		if guess(k):
			break
	elif line == 'histyory' or line=='h?':
	print(list(history))
#猜数字的小游戏,每次退出后存储猜的数据,使用pickle模块
from random import randint
from collections import deque
N=randint(0100)
history = deque([],5)
def guess(k):
	if k==N:
		print('right')
		return True
	if k<N:
		print('%s is less-than N' % k)
	else:
		print('%s is greater-than N' % k)
	return False
while True:
	line=raw_input("please input a number:")
	if line.isdigit():
		k=int(line)
		history.append(k)
		if guess(k):
			break
	elif line == 'histyory' or line=='h?':
	print(list(history))

二、迭代器与生成器相关话题

问题1:如何实现可迭代对象和迭代器对象?

实际案例

某软件要求,从网络抓取各个城市气温信息,并依次显示:
北京:15~20
天津:17~22
长春:12~18

如果一次抓取所有城市天气再显示,显示第一个城市气温时,有很高的延时,并且浪费存储空间,我们期望以“用时访问”的策略,并且能把所有城市气温封装到一个对象里,可用for语句进行迭代,如何解决?

解决方案:
Step1:实现一个迭代器对象WeaterIterator,next方法每次返回一个城市气温
Step2:实现一个可迭代对象WeatherIterator,__iter__方法返回一个迭代器对象

#coding:utf-8
import requests
def geteweather(city):
	r=requests.get(u'http://wthrcdn.etouch.cn/weather_mini?city='+city)
	data=r.json()['data']['forecast'][0]
	return '%s:%s,%s'%(city,data['low'],data['high'])
	
	#[u'北京',u'上海',u'广州',u'长春']
	print(geteweather(u'北京'))
	print(geteweather(u'长春'))

在这里插入图片描述

from collections import Iterable,Iterator

class WeatherIterator(Iterator):
	def __init__(self,cities):
		self.cities=cities
		self.index=0
	
	def getweather(self,city):
		r=requests.get(u'http://wthrcdn.etouch.cn/weather_mini?city='+city)
		data=r.json()['data']['forecast'][0]
		return '%s:%s,%s'%(city,data['low'],data['high'])
	
	def next(self):
		if self.index==len(self.cities):
			raise StopIteration   #如果报StopIteration,停止迭代
		city=self.cities[self.index]
		self.index+=1
		return self.getweather(city)

class WeatherIterable(Iterable):
	def __init__(self,cities):
		self.cities=cities
	
	def __iter__(self):
		return WeatherIterator(self.cities)
		
for x in WeatherIterable([u'北京',u'上海',u'广州',u'长春']):
	print x

问题2:如何使用生成器函数实现可迭代对象?

实际案例

实现一个可迭代对象的类,它能迭代出给定范围内所有素数:
pn=PrimeNumbers(1,30)
for k in pn:
print(k)

输出结果:
2 3 4 5 6

解决方案:将该类的__iter__方法实现成生成器函数,每次yield返回一个素数。

三、字符串处理相关话题

问题1:如何拆分含有多种分隔符的字符串?

实际案例

我们要把某个字符串依据分隔符号拆分不同的手段,该字符串包含多种不同的分隔符,例如:
s=‘ab;cd|efg|hi,jkl\mn\pq;rst,uvw\txyz’
其中, ; | \ 都是分隔符号,如何处理?

解决方案:
方法一:连续使用str.split()方法,每次处理一种分隔符号
方法二:使用正则表达式的re.split()方法,一次性拆分字符串(推荐)

问题2:如何判断字符串a是否以字符串b开头或结尾?

实际案例

某文件系统目录下有一系列文件:
quicksort.c
qraph.py
heap.java
install.sh
stack.cpp

编写程序给其中所有.sh文件和.py文件加上用户可执行权限
解决方案:使用字符串的str.startswith() he str.endswith()方法
注意:多个匹配时参数使用元组

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

问题3: 如何调整字符串中文本的格式?

实际案例

某软件的log文件,其中的日期格式为‘yyyy-mm-dd’:
2022-01-13 15:42:26 status unpacked python3-pip:all

我们想把其中日期改为美国日期的格式“mm/dd/yyyy”
‘2022-01-13’ -> ‘13/01/2022’, 应如何处理?

解决方案:使用正则表达式 re.sub() 方法做字符串替换,利用正则表达式的捕获组,捕获每个部分内容,在替换字符串中调整各个捕获组的顺序。

四:文件I/O操作相关话题

待更新

五:数据编码与处理相关话题

待更新

六:类与对象相关话题

待更新

七:多线程与多进程相关话题

待更新

八:装饰器相关话题

待更新

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值