python中常见的面试题

Long_1979

已于 2024-07-20 00:39:46 修改

阅读量425

点赞数 15

分类专栏： Python 面试文章标签： python 开发语言

于 2024-07-20 00:39:15 首次发布

本文链接：https://blog.csdn.net/Long_1979/article/details/140560136

版权

Python 同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

面试

3 篇文章 0 订阅

订阅专栏

一、Python基础知识

Python的数据类型有哪些？
- 整型（int）、浮点型（float）、字符串（str）、布尔型（bool）、列表（list）、元组（tuple）、字典（dict）、集合（set）等。
Python中列表（list）和元组（tuple）的区别是什么？
- 列表是可变的，可以动态地添加、删除或修改元素；而元组是不可变的，一旦创建就不能修改其元素。
Python中的生成器和迭代器是什么？它们之间有什么区别？
- 迭代器是一个可以记住遍历的位置的对象，用于简化循环代码并节省内存。它有两个基本方法：iter() 和 next()。
- 生成器是一种特殊的迭代器，它使用yield关键字定义，可以暂停和恢复执行。生成器函数在每次调用next()时，会执行到下一个yield表达式，然后返回结果。
什么是闭包？装饰器又是什么？装饰器有什么作用？
- 闭包是指一个函数值及其相关的引用环境组合而成的实体。
- 装饰器是一种用于增强函数或类功能的工具，它允许用户在不修改原有函数或类定义的情况下，给函数或类添加新的功能。
- 装饰器的主要作用包括：不修改原有函数或类的源代码、不修改原有函数或类的调用方式，为函数或类添加额外的功能。
Python中的*args和**kwargs是什么意思？
- *args用于接收任意数量的位置参数，并将它们存储在一个元组中。
- **kwargs用于接收任意数量的关键字参数，并将它们存储在一个字典中。

二、Python进阶技能

如何在Python中实现列表去重？
- 可以使用集合（set）来去重，因为集合是一个无序的、不重复的元素集。例如：list(set(my_list))。但需要注意的是，这种方法会丢失原始列表中的顺序，如果需要保持顺序，可以使用其他方法，如遍历列表并使用一个辅助集合来检查元素是否已存在。
Python中的GIL（Global Interpreter Lock）是什么？它如何影响多线程？
- GIL是Python的全局解释器锁，它用于保证在同一进程中只有一个线程能够执行Python字节码。这意呀着，尽管Python支持多线程，但由于GIL的存在，多线程在执行时并不是真正并行的，而是交替执行的。这限制了Python在多线程环境下的性能提升。
Python中如何实现并发编程？
- Python中可以通过多种方式实现并发编程，包括使用多线程（尽管受GIL限制）、多进程、异步编程（使用asyncio库）以及使用并发库如concurrent.futures等。
Python中如何进行内存管理？Python的垃圾回收机制是怎样的？
- Python中的内存管理主要依赖于垃圾回收机制。Python的垃圾回收机制主要采用了引用计数和代际收集（分代收集）两种策略。引用计数用于跟踪对象的引用数量，当引用数量变为0时，对象将被视为垃圾并被回收。代际收集则根据对象的存活时间来划分不同的代，并分别进行垃圾回收，以提高回收效率。

三、实际应用场景

你如何使用Python进行数据处理和分析？
- 可以使用Pandas库进行数据处理和分析，Pandas提供了丰富的数据结构（如DataFrame）和数据分析工具（如分组、聚合、筛选等）。
你如何使用Python进行Web开发？
- 可以使用Flask或Django等Web框架进行Python Web开发。这些框架提供了路由、模板渲染、数据库操作等功能，使得开发Web应用变得更加简单和高效。
你如何使用Python进行自动化测试？
- 可以使用unittest、pytest等测试框架进行Python自动化测试。这些框架提供了丰富的测试功能和断言方法，使得编写和执行测试用例变得更加容易和高效。

面向对象的编程

面向对象的编程（Object-Oriented Programming，简称OOP）是一种编程范式，它使用“对象”来设计软件。这种范式强调将现实世界中的实体或概念（如汽车、人等）抽象为软件中的对象，并通过这些对象之间的交互来设计软件系统。

1. 封装（Encapsulation）

封装是面向对象编程的核心特性之一，它隐藏了对象的内部实现细节，只对外提供有限的接口。

例子：银行账户类

class BankAccount: 
def __init__(self, owner, balance=0): 
self.__owner = owner # 使用双下划线表示私有属性 
self.__balance = balance 


def deposit(self, amount): 
if amount > 0: 
self.__balance += amount 
print(f"{amount} 已存入账户。") 
else: 
print("存款金额必须大于0。") 


def withdraw(self, amount): 
if 0 < amount <= self.__balance: 
self.__balance -= amount 
print(f"{amount} 已从账户中取出。") 
else: 
print("余额不足或取款金额必须大于0。") 


def get_balance(self): 
return self.__balance 


# 使用BankAccount类 
account = BankAccount("张三", 1000) 
account.deposit(500) 
account.withdraw(300) 
print(f"当前余额为：{account.get_balance()}")

在这个例子中，__owner和__balance是私有属性，外部不能直接访问它们，只能通过类提供的方法（如deposit、withdraw和get_balance）来操作这些属性。

2. 继承（Inheritance）

继承允许我们定义一个类（子类）来继承另一个类（父类）的属性和方法。子类可以拥有父类的所有公共和保护成员，并可以添加自己的属性和方法或重写父类的方法。

例子：学生类继承人类

class Person: 
def __init__(self, name, age): 
self.name = name 
self.age = age 


def introduce(self): 
print(f"我是{self.name}，今年{self.age}岁。") 


class Student(Person): 
def __init__(self, name, age, student_id): 
super().__init__(name, age) # 调用父类的__init__方法 
self.student_id = student_id 


def study(self): 
print(f"{self.name}正在学习。") 


# 使用Student类 
student = Student("李四", 20, "S001") 
student.introduce() 
student.study()

在这个例子中，Student类继承了Person类，并添加了自己的student_id属性和study方法。通过super().__init__(name, age)调用了父类的__init__方法，实现了属性的继承。

3. 多态（Polymorphism）

多态允许我们以统一的接口使用不同的类，这些类继承自同一个基类并实现了相同的方法，但每个类可以有不同的实现方式。

例子：动物类及其子类


	class Animal: 

	def make_sound(self): 

	pass 

	


	class Dog(Animal): 

	def make_sound(self): 

	print("汪汪汪") 

	


	class Cat(Animal): 

	def make_sound(self): 

	print("喵喵喵") 

	


	def animal_sound(animal): 

	animal.make_sound() 

	


	# 使用多态 

	dog = Dog() 

	cat = Cat() 

	animal_sound(dog) # 输出：汪汪汪 

	animal_sound(cat) # 输出：喵喵喵

在这个例子中，Dog和Cat类都继承了Animal类，并重写了make_sound方法。animal_sound函数接受一个Animal类型的参数，并调用其make_sound方法。由于多态性，我们可以将Dog或Cat的实例传递给这个函数，并得到不同的输出。

Python的内存管理机制

Python的内存管理机制主要包括以下几个方面：

内存分配
- 栈内存（Stack Memory）：栈内存用于存储函数调用过程中创建的局部变量。当函数调用结束时，这些局部变量会被自动销毁。
- 堆内存（Heap Memory）：堆内存用于动态分配内存，对象和数据结构通常存储在堆内存中。这些对象的内存不会自动释放，需要垃圾收集器来管理。
引用计数（Reference Counting）
- 每个Python对象都有一个引用计数，用于记录当前有多少个引用指向该对象。当引用计数减少为零时，说明没有任何引用指向该对象，即该对象不再被使用，可以被销毁并释放内存。
- 引用计数机制实现了对于内存块的立即回收，允许高效地处理许多短期对象的创建和销毁。
对象池（Object Pools）和自由列表（Free Lists）
- Python使用内存池来管理小对象（如整数和短字符串）的内存，避免频繁分配和释放内存。这些对象在被释放时不会真正被销毁，而是放入自由列表中，以便下次使用时直接从列表中取出，而无需重新分配内存。
- 对象池是一种设计模式，主要用于管理对象的复用，通过从对象池中分配小对象，可以最小化内存碎片并提高性能。

Python的垃圾回收机制

Python的垃圾回收机制主要包括引用计数和标记-清除（Mark and Sweep）两种策略，以及分代回收（Generational Collection）作为辅助。

引用计数
- 如前所述，每个对象都有一个引用计数器，用于跟踪对象的引用情况。当引用计数为零时，对象被视为可回收。
- 引用计数机制简单高效，但无法处理循环引用问题。
标记-清除
- 当出现循环引用时，引用计数机制无法回收这些对象。此时，Python的垃圾回收器会启动标记-清除算法。
- 标记阶段：从根对象（如全局变量、活动函数调用栈等）开始，递归地遍历所有可访问的对象，并在其上打上标记。
- 清除阶段：遍历整个内存空间，释放所有未标记的对象所占用的内存。
分代回收
- 分代回收是建立在标记-清除的基础上的优化策略。Python将对象分为不同的代（Generation），新创建的对象被分配在第0代，随着时间的推移，存活下来的对象依次晋升到下一代。
- 垃圾回收器会根据对象的代来决定扫描的频率，较新的代会更频繁地被扫描，而较旧的代则较少被扫描，以提高垃圾回收的效率。

总结

Python的内存管理机制和垃圾回收机制为开发者提供了自动、高效的内存管理方案。通过引用计数和标记-清除算法的结合使用，以及分代回收的优化策略，Python能够有效地管理和回收内存资源，避免内存泄漏和资源浪费。这些机制允许开发者专注于编写代码逻辑，而无需过多关注内存管理的细节。

在Python中，理解深拷贝（deep copy）和浅拷贝（shallow copy）之间的区别非常重要，尤其是在处理复杂数据结构（如列表、字典、嵌套对象等）时。这两种拷贝方式都用于复制对象，但它们在处理对象内部的引用时表现不同。

浅拷贝（Shallow Copy）

浅拷贝会创建一个新的对象，这个对象有着原始对象属性值的一份精确拷贝。如果属性是值类型（如整数、浮点数、字符串等），拷贝对象和原始对象对应的属性值完全独立，修改一个对象的这些属性值不会影响到另一个对象。但是，如果属性是引用类型（如列表、字典、集合、其他对象等），拷贝对象和原始对象会共享这些属性的引用，即它们指向同一个对象。因此，修改一个对象中引用类型的属性会影响到另一个对象。

Python中，可以使用copy模块的copy()函数来实现浅拷贝。

代码示例如下：

import copy 


original_list = [1, 2, [3, 4]] 
copied_list = copy.copy(original_list) 


original_list[1] = 5
original_list[2][0] = 'a' # 修改原始列表中的嵌套列表 
print(original_list) # 输出: [1, 5, ['a', 4]] 
print(copied_list) # 输出: [1, 2, ['a', 4]]，注意这里只是列表中的值被修改了

深拷贝（Deep Copy）

深拷贝会创建一个新的对象，并且递归地复制原始对象中的所有子对象，创建出所有对象的一份完全独立的拷贝。因此，深拷贝对象和原始对象之间没有共享任何子对象（包括嵌套的对象）。修改深拷贝对象中的任何内容都不会影响到原始对象。

Python中，可以使用copy模块的deepcopy()函数来实现深拷贝。

代码示例如下：

import copy



original_list = [1, 2, [3, 4]]

copied_list_deep = copy.deepcopy(original_list)



original_list[2][0] = 'a' # 修改原始列表中的嵌套列表

print(original_list) # 输出: [1, 2, ['a', 4]]

print(copied_list_deep) # 输出: [1, 2, [3, 4]]，这里没有被修改

总结

浅拷贝：只复制对象本身，而不复制对象内部引用的其他对象。
深拷贝：不仅复制对象本身，还递归地复制对象内部引用的所有其他对象。

选择使用哪种拷贝方式取决于你的具体需求，如果你需要完全独立的对象副本，且对象内部有复杂的嵌套结构，那么深拷贝是更好的选择。然而，深拷贝的开销通常比浅拷贝大，因为它需要复制更多的数据。

ACID

ACID是数据库管理系统（DBMS）中事务（Transaction）所具有的四个基本特性的缩写，它们分别是：

原子性（Atomicity）：事务作为一个整体被执行，要么全部执行，要么全部不执行。这意味着，事务在执行过程中发生错误会被回滚（Rollback）到事务开始前的状态，就像这个事务从未执行过一样。
一致性（Consistency）：事务必须使数据库从一个一致性状态变换到另一个一致性状态。一致性的含义是数据库数据的完整性约束没有被破坏。例如，在一个转账过程中，如果事务因为某些原因中断，那么账户的总金额应该保持不变，即从一个平衡状态回到另一个平衡状态。
隔离性（Isolation）：并发执行的事务之间不会互相干扰，每个事务的执行结果不会被其他并发执行的事务所影响。数据库系统提供了一定级别的隔离，以防止多个事务并发执行时由于交叉执行而导致数据的不一致。隔离级别从低到高通常有读未提交（Read Uncommitted）、读已提交（Read Committed）、可重复读（Repeatable Read）和串行化（Serializable）等几种。
持久性（Durability）：一旦事务被提交，它对数据库的修改就是永久性的，即使数据库系统发生故障也不会丢失。为了确保持久性，事务提交后，所做的修改必须被永久地保存在非易失性存储（如硬盘）上。

这四个特性是设计数据库事务时的重要原则，它们共同保证了数据库操作的正确性和可靠性。ACID特性使得数据库事务成为了一种可靠的数据处理方式，广泛应用于各种需要数据一致性和完整性的应用场景中。

TCP（传输控制协议）的三次握手和四次挥手是TCP/IP协议中用于建立连接和关闭连接的重要机制。下面分别详细解释这两个过程：

TCP的三次握手

TCP的三次握手用于在客户端和服务器之间建立一个可靠的连接。这个过程通过三个步骤完成，确保双方都能够准备好接收和发送数据。

第一次握手：
- 客户端发送一个SYN（同步序列编号）包（SYN=j）到服务器，并进入SYN_SEND状态，等待服务器确认。
- 这个SYN包包含了客户端的初始序列号j，用于后续的确认和数据同步。
第二次握手：
- 服务器收到SYN包后，必须确认客户的SYN（ACK=j+1），表示已经收到了客户端的SYN包。
- 同时，服务器自己也发送一个SYN包（SYN=k），即SYN+ACK包，作为对客户端的响应，并进入SYN_RECV状态。
- 这个SYN+ACK包包含了服务器的初始序列号k，并确认了客户端的序列号j+1。
第三次握手：
- 客户端收到服务器的SYN+ACK包后，向服务器发送一个确认包ACK（ACK=k+1），表示已经收到了服务器的SYN+ACK包。
- 此包发送完毕，客户端和服务器都进入ESTABLISHED状态，完成三次握手。
- 此时，双方都可以开始传送数据。

三次握手的主要目的是确保双方都能够准备好接收和发送数据，并且双方都对对方的初始序列号进行了确认，从而保证了后续数据传输的可靠性和同步性。

TCP的四次挥手

TCP的四次挥手用于关闭一个已经建立的连接。这个过程通过四个步骤完成，确保双方都能够正确地关闭连接，并释放所占用的资源。

第一次挥手：
- 客户端发送一个FIN报文段给服务器，表示客户端想要关闭连接，并关闭客户端到服务器的数据传送。
- 客户端进入FIN_WAIT_1状态，等待服务器的确认。
第二次挥手：
- 服务器收到FIN报文段后，发送一个ACK报文段给客户端，确认序号为收到序号+1，表示已经收到了客户端的FIN报文段。
- 服务器进入CLOSE_WAIT状态，但此时服务器仍然可以向客户端发送数据。
第三次挥手：
- 当服务器完成所有数据的发送后，也向客户端发送一个FIN报文段，表示服务器也想要关闭连接。
- 服务器进入LAST_ACK状态，等待客户端的确认。
第四次挥手：
- 客户端收到服务器的FIN报文段后，发送一个ACK报文段给服务器，确认序号为收到序号+1，表示已经收到了服务器的FIN报文段。
- 客户端进入TIME_WAIT状态，并等待足够长的时间（通常是2MSL，即报文最大生存时间的两倍），以确保服务器收到了ACK报文段，并且所有的数据都已经传输完毕。
- 最后，客户端进入CLOSED状态，连接关闭。
- 服务器在收到客户端的ACK报文段后，也进入CLOSED状态，连接彻底关闭。

四次挥手的主要目的是确保双方都能够正确地关闭连接，并释放所占用的资源。通过这四个步骤，双方都可以确保没有数据在传输过程中丢失，并且连接已经安全地关闭。

GET和POST的区别

GET和POST是HTTP协议中两种常用的请求方法，它们在多个方面存在显著的区别。以下是GET和POST之间的主要区别：

1. 本质区别

GET：主要用于从服务器获取数据或资源。它是一种幂等且安全的方法，即多次请求同一资源应返回相同的结果，且不会对服务器上的数据状态产生任何改变。
POST：主要用于向服务器提交数据，以创建或更新资源。POST请求通常用于提交表单数据、上传文件或在服务器上执行某些操作。

2. 参数传递方式

GET：请求的数据（参数）附在URL后面，以查询字符串的形式出现，通过问号（?）分隔主体URL与查询字符串，参数间用等号（=）赋值，多个参数间用&连接。这种方式使得GET请求的URL对用户是可见的，并且易于分享和收藏。
POST：请求的数据包含在请求体中（request body），而不是URL中。这种方式使得POST请求能够传输大量数据，并且不会受到URL长度的限制。此外，POST请求的数据不会显示在浏览器的地址栏中，因此相对更安全。

3. 缓存性

GET：请求是可以被缓存的。浏览器、代理服务器等可能会缓存GET请求的结果，以加快后续请求的响应速度。
POST：请求默认是不被缓存的。因为POST请求通常用于提交数据，其响应结果可能会因提交的数据不同而有所不同，因此不适合被缓存。

4. 安全性

GET：由于GET请求的数据是附在URL后面的，因此可能会通过浏览器历史记录、服务器日志等方式泄露敏感信息。虽然可以通过SSL/TLS加密传输过程来提高安全性，但URL本身仍然可能暴露敏感信息。
POST：POST请求的数据包含在请求体中，不会直接暴露在URL中，因此在一定程度上提高了数据的安全性。然而，这并不意味着POST请求就是完全安全的，还需要结合其他安全措施（如HTTPS、数据加密等）来确保数据传输的安全性。

5. 数据长度限制

GET：由于URL长度的限制（通常为2K~4K，但不同浏览器和服务器可能有所不同），GET请求传输的数据量相对较小。
POST：POST请求的数据是放在请求体中的，因此没有长度限制（实际上受限于服务器配置和客户端的上传能力）。这使得POST请求能够传输大量数据。

6. 幂等性

GET：是幂等的，即多次请求同一资源应返回相同的结果。
POST：通常不是幂等的，因为每次POST请求都可能导致服务器上的数据状态发生改变。

7. 浏览器行为

GET：请求页面后退时，浏览器通常会从缓存中读取数据，而不会重新发送请求。
POST：请求页面后退时，浏览器通常会重新发送请求（尽管具体行为可能因浏览器和配置而异）。这可能会导致重复提交表单数据等问题。

总结

综上所述，GET和POST在本质、参数传递方式、缓存性、安全性、数据长度限制、幂等性和浏览器行为等方面都存在显著的区别。在实际应用中，应根据具体需求选择合适的请求方法。

Long_1979

关注

15
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python中常见的面试题

Python的内存管理机制和垃圾回收机制为开发者提供了自动、高效的内存管理方案。通过引用计数和标记-清除算法的结合使用，以及分代回收的优化策略，Python能够有效地管理和回收内存资源，避免内存泄漏和资源浪费。这些机制允许开发者专注于编写代码逻辑，而无需过多关注内存管理的细节。在Python中，理解深拷贝（deep copy）和浅拷贝（shallow copy）之间的区别非常重要，尤其是在处理复杂数据结构（如列表、字典、嵌套对象等）时。这两种拷贝方式都用于复制对象，但它们在处理对象内部的引用时表现不同。
复制链接

扫一扫