Python面试题

最新推荐文章于 2024-12-09 22:12:04 发布

wuxing164

最新推荐文章于 2024-12-09 22:12:04 发布

阅读量252

点赞数

分类专栏： python

python 专栏收录该内容

1 篇文章

订阅专栏

出处:https://github.com/Senglin75/interview_of_python

语言特性

1.说一下 Python 中 LEGB 是什么

LEGB 指的是 Python 中的变量作用域问题，其中

L：local 局部变量，仅存在函数内部，其存储位置位于栈中，其生命周期在函数结束时就会被释放。

E：enclosing 外部作用域变量，常见于闭包函数，也就是嵌套函数中的上一层函数变量。其生命周期在整个闭包函数结束时会被释放。

G：global 全局变量，作用于整个程序，其存储位置位于全局数据区中，其生命周期在程序销毁时就被释放。

B：builtins 内建模块变量，其存储于内置变量命名空间。

变量查找顺序：

L-E-G-B

2.解释一下 Python 中的闭包函数

示例：

def func():
    a = b = 1
    def internal_func(c):
	if a+b == c:
	    print('True')
	else:
	    print('False')

test = func()
test(2)

# 结果为 True

闭包函数作为函数式编程中的一种，当含有以下几点时，便可称它为一个闭包函数。

该函数是一个嵌套函数。
内嵌函数必须引用外部函数的变量。
该函数的返回值必须是内嵌函数名

闭包函数可以大幅提高代码复用性，使得代码性能大幅提高。

3.说一下 Python 中的深拷贝，浅拷贝，如何自己实现深拷贝

浅拷贝

copy 模块下的 copy() 方法，实现一个对象的浅拷贝，list 下的分割也是一种浅拷贝，

示例：

import copy

a = [1, 2, [3, 4]]
b = copy.copy(a)

a == b
a is b

# 结果为 True，False

e = [1, 2, [3, 4]]
f = e[2]
h = e[2][:]

f == h
f is h

# 结果为 True，False

浅拷贝只会拷贝对象的第一层引用，如果是复合类型，如 list 里面嵌套 list，则当内嵌 list 发生变化时，经过浅拷贝出来的对象，也会发生变化。

示例：

import copy

a = [1, 2, [3, 4]]
b = copy.copy(a)

a == b
a is b

# 结果为 True，False

c = copy.copy(a)

a[1] = 0

print(a)
print(c)

# 结果为 a = [1, 0, [3, 4]], c = [1, 2, [3, 4]]


a[2].append(5)

print(a)
print(c)

# 结果为 a = [1, 0, [3, 4, 5]], c = [1, 2, [3, 4, 5]]

深拷贝

深拷贝将拷贝对象里所有引用全部拷贝，生成一个全新的对象。

示例：

import copy

a = [1, 2, 3, 4]
b = copy.deepcopy(a)

a == b 
a is b

# 结果为 True，False

深、浅拷贝会根据拷贝对象的数据类型，决定是否开辟新的内存空间来存放拷贝出来的新对象。

import copy

a = [1, 2, 3, 4] # list 可变类型
b = copy.copy(a)

a == b
a is b

# 结果为 True，False

c = (1, 2, 3, 4)  # tuple 不可变类型
d = copy.copy(c)
e = copy.deepcopy(c)

c == d
c is d
c is e

# 结果为 True，True, True

自己实现深拷贝

深拷贝源码分析，先占坑，还未写。

4.说一说 Python 中的可变、不可变类型

Python 中通过将对象进行 HASH 来判断该对象是哪种类型，可 HASH 的为不可变类型，不可 HASH 的为可变类型。其中常见的几种如下所示：

可变类型：List，dict，set
不可变类型：int，float，string，tuple，frorzenset

也可通过是否含有__hash__()方法，判断该对象为何种类型，拥有该方法的为不可变类型，相反为可变类型。

5.说一说 Python 中一个类的实例从创建到删除的过程

首先通过类的魔法方法__new__()来创建一个实例，再通过魔法方法__init__()来对这个实例初始化，最终删除一个实例时，Python 根据该实例的「引用计数」来判断是否释放该实例所占用的内存，当该实例的引用计数为 0 时，__del__()方法才会被调用，__del__()方法的不等同于del。

6.什么是单例，如何实现

单例是指一个类的实例有且只有一个。一般在一个类只需要使用一次之后便不在使用时使用。

实现方式：

使用__new__()方法

class Singleton():
    is_instance = None

    def __new__(cls):
        if not cls.is_instance:
            cls.is_instance = super().__new__(cls)
            return cls.is_instance

        return cls.is_instance
        
s = Singleton()
g = Singleton()
print(s is g)

# 结果为 True

使用装饰器

def Singleton01(cls):
    is_instance = {}
    def get_instance(*args, **kwargs):
        if not is_instance:
            is_instance[cls] = cls()
            return is_instance[cls]
        return is_instance[cls]
    return get_instance


@Singleton01
class Myclass():
    pass

s = Myclass()
g = Myclass()
print(s is g)

# 结果为 True

多线程下实现单例

class Singleton02():
    is_instance = None
    is_lock = threading.Lock()

    def __new__(cls):
        with cls.is_lock:
            if not cls.is_instance:
                cls.is_instance = super().__new__(cls)
                return cls.is_instance

            return cls.is_instance


s = Singleton()
g = Singleton()
print(s is g)

# 结果为 True

多线程优化

class Singleton03():
    is_instance = None
    is_lock = threading.Lock()

    def __new__(cls):
        # 单例判断提前,只在第一次判断时加锁，避免无意义的加锁解锁
        if not cls.is_instance:
            with cls.is_lock:
                cls.is_instance = super().__new__(cls)
                return cls.is_instance

        return cls.is_instance

s = Singleton03()
g = Singleton03()
print(s is g)

# 结果为 True

第二次更新

7.说一下 Python 中的装饰器

原理：利用闭包，将目标函数外面再套一层函数，使得目标函数具有一个新的功能，并且不改变目标函数原有功能。

实现方式：

闭包

def decorate(func):
    def wrapper():
        print('新功能')
        func()    
    return wrapper

def func():
    print('原有功能')

f = decorate(func)
f()

# 结果为：
新功能
原有功能

@ 语法糖

def decorate01(func):
    def wrapper():
        print('新功能')
        func()       
    return wrapper

@decorate01
def func01():
    print("原有功能")

func01()

# 结果为：
新功能
原有功能

8.说一说类属性、实例属性、私有属性和保护属性

类属性相当于全部变量，所有由类创建出来的实例，都可以使用，而实例属性相当于局部变量，只能由该实例自己使用，当类属性与实例属性命名一样时，在调用该同名属性时，会屏蔽掉类属性，调用实例属性，这点跟 LEGB 很像。

当通过实例对象来修改类属性时，其实修改的并不是类属性，而是新建了一个跟类属性名一样的实例属性。

Python 中将以两个下划线__开头，但不以两个下划线结尾的变量，认作为私有属性，Python 通过 name manage算法，将该私有属性的引用更改为_classname_reference，用户试图调用该私有属性时，会因为对象引用不一样而找不到该属性，故而实现了「属性私有化」。

在获取实例属性时，一般采用定义一个实例方法的方式获取属性，避免直接对实例属性进行操作，起到一个保护属性的作用。

9.为什么说 Python 是动态语言，鸭子类型是指什么

Python 相当于其他静态语言，可以在代码运行过程中，改变变量的属性。

鸭子类型指的是 Python 不用定义变量类型，只要该变量像是什么类型，那么就认为它就是什么类型，我们更多关注的是它的行为，而不是它的类型。

10.元类是什么

实例都是由类创建出来，而类则是由元类创建出来。他们之间的关系相当于「奶奶-妈妈-孙子」。

示例：

class Myclass():
    pass


new = type('NewClass', (Myclass,), {'name': 'new'})

print(new)
print(new.__mro__)  # 查看该类的继承情况

# 结果为
<class '__main__.NewClass'>
(<class '__main__.NewClass'>, <class '__main__.Myclass'>, <class 'object'>)

具体点的内容可以参考这篇问答：什么是元类

11.@staticmethod 和 @classmethod 的区别

@staticmethod 是为类添加一个静态方法
@classmethod 是为类添加一个类方法

12.如何动态添加属性

由于 Python 的特性使得程序在运行过程中，我们可以为某个对象添加属性、方法。

示例：

class Myclass:
    pass


m = Myclass()

# 为实例动态添加一个属性
m.name = 'new_atribute'

def func(self):
    return 'new_function'

# 为实例动态添加一个方法
m.func = func

print(m.name)
print(m.__dict__) # 返回 m 的所有属性,方法

# 结果为
new_atribute
new_function
{'func': <function func at 0x7f9452be12f0>, 'name': 'new_atribute'}

# 另外一种动态添加方法
import types


def func01(self):
	print('new_function01')

# 实例 m 添加一个属性 func，而这个属性指向func()函数，故当调用 m.func 时，也就相当于调用了 func() 函数，间接实现了为 m 添加方法 func()。
m.func = types.MethodType(func, m)

print(m.func())

# 结果为 new_function01

13.对于迭代器和生成器你知道哪些，它们分别应用于什么场景

先介绍什么是可迭代的Iterable：

任何可用于for循环的都是可迭代的。也可以使用collection模块下的isinstance(obj, Iterable)来检验该对象是否可迭代。

示例：

from collections import Iterable


print(isinstance('abc',Iterable)) 
print(isinstance(123,Iterable)) 

# 结果为 True，False

迭代器

任何可以使用next()函数的都是迭代器，也可使用iter()函数将可迭代对象变为迭代器。

示例：

from collections import Iterator


itr = iter('abc')

print(type(itr))
print(isinstance(itr, Iterator)) 

# 结果为 Iterator，True

生成器

任何函数中含有yield关键字的都是生成器，列表生成式中的[]改为()也是一个生成器。

生成器在启动后，如果程序运行到yeild关键字时，会从当前程序退出，并返回yeild关键后面的内容。
- 实现方式
  
  示例：
```
g = [i for i in range(10)]

print(type(g))

# 结果为 list

g1 = (i for i in range(10))

print(type(g1))

# 结果为 generator

def func():
    for i in range(10):
        yield i

# 生成生成器
f = func()
# 启动生成器，并接受 yeild 后面的值
res = next(f)
print(f)
print('return content: %d' % res)

# 结果为
<generator object func at 0x7f92f5294048>
return content: 0
```
- 生成器怎么取值，什么时候结束
  生成器可以通过next(f)、f.__next__()和f.send()三种方式来取值
  示例：
```
def func01():
    for i in range(10):
        yield i

f = func()
print(next(f))
print(f.__next__())
print(f.send('hahah'))

# 结果为 
0
1
2
```
  其中f.send()可以向生成器传值，但是其第一次传入的值默认为None。如果想要取出send()里传入的值，则需要在生成器中添加接收的变量。
  
  示例：
```
def func():
    content = '200 OK'
    while True:
        temp = yield content
        print(temp) 

f = func()
# 传入 None 来启动生成器
f.send(None)       
# 传入参数给生成器
res = f.send('END')

print(res)  

# 结果为
END
200 OK
```
  生成器里的值被取完之后，或者中间遇到return关键字，就会退出，这三种方法有一个共同点：当生成器取完之后会抛出StopIteration的错误。
  而使用for循环来取出生成器里的值就不会抛出错误，这也是最被推荐的。
- 应用场景
  在生成一个包含很多数（百万级别）的列表时，但是又只用得到其中很小一部分的数时，使用列表生成式会极大的浪费内存，且不一定能够生成，因为受机器内存限制。
  而使用生成器则不然，生成器只是在你需要的时候，才会申请一块内存，可以边取边用，极大的降低了内存消耗。生成器用的最多的地方在于「协程」。由于基于 C 解释器下的 Python 中含有一个 GIL 锁，使得 Pyhon 的多线程是一个假性多线程，这也是为什么很多人说 Python 性能慢的原因。

第三次更新

14.说一下进程、线程、以及多任务（多进程、多线程和协程）

进程

概念

一个程序对应一个进程，这个进程被叫做主进程，而一个主进程下面还有许多子进程。

实现方式

fork()

示例：

import os
      
      
print('current_pid :%d' % os.getpid())
  
res = os.fork()
  
# 子进程返回的是 0
if res == 0:
  	print('res: %d' % res)
  	print('sub_pid: %d' % os.getpid())
  
# 主进程返回的是子进程的 pid
else:
  	print('main_pid: %d' % os.getpid())
 	print('res：%d' % res)
  
# 结果为
current_pid :12775
main_pid: 12775
res：12776
res: 0
sub_pid: 12776

 
 * multiprocessing.Process
 
   示例：
 
   ```
   from multiprocessing import Process
   import os, time
   
     
   print('man_process pid : %d' % os.getpid())
     
   class NewProcess(Process):
       def __init__(self):
           Process.__init__(self)
     
       def run(self):
           time.sleep(3)
           print('%d process was runing' % os.getpid())
     
   np = NewProcess()
   np.start()
     
   # 结果为
   man_process pid : 7846
   7847 process was runing

multiprocessing.Pool

同步（apply）

示例：

from multiprocessing import Pool
import time, os, random  


print('main_process pid: %d' % os.getpid())

def run():
    time.sleep(random.random())  # random.random() 随机生成一个小于 1 的浮点数
    print('%d process was runing' % os.getpid())

p = Pool(3)

for i in range(4):
    p.apply(run, args=())

p.close()
print('waiting for sub_process')

while True:
    # 获取 Pool 中剩余的进程数量
    count = len(p._cache)
    if count != 0:
        print('there was %d sub_process' % count)
        time.sleep(random.random())
    else:
        break
      
print('sub_process has done')

# 结果为
main_process pid: 4295
4297 process was runing
4296 process was runing
4298 process was runing
4297 process was runing
wating for sub_process
sub_process has done

异步（apply_async)

示例：

from multiprocessing import Pool
import time, os, random
    
    
print('main_process pid: %d' % os.getpid())
    
def run():
	# random.random() 随机生成一个小于 1 的浮点数
    time.sleep(random.random())  
    print('%d process was runing' % os.getpid())
  
p = Pool(3)
    
for i in range(4):
    p.apply_async(run, args=())
    
p.close()
    
while True:
    # 获取 Pool 中剩余的进程数量
    count = len(p._cache)
    if count != 0:
        print('there was %d sub_process' % count)
        time.sleep(random.random())
    else:
    break
            
print('wiating for sub_process..')
p.join()

print('sub_process has done')
  
# 结果为
main_process pid: 4342
wiating for sub_process..
there was 4 sub_process
4344 process was runing
there was 3 sub_process
4345 process was runing
4344 process was runing
4343 process was runing
sub_process has done

优缺点
- fork()是计算机最底层的进程实现方式，一个fork()方法创建出来的进程有两个：主进程、子进程。fork()创建出来的进程，主进程不会等待子进程。
- multiprocessing模块通过将fork方法封装成一个Process类，该类有一个start()方法，当调用该方法时，会自动调用run()方法，开启一个进程。并且由Process创建出来的进程，可以使用join()方法，使得主进程堵塞，被迫等待子进程。
- multiprocess下另一种开启进程的方式是通过Pool进程池来实现。进程池可以开启多个进程来执行多个任务，但是进程数最大不会超过系统 CPU 核数。同样的，由Pool创建出来的进程，主进程也不会等待子进程，通过join()方法可以迫使主进程等待子进程，或者使用apply()同步的方式。

进程通信

进程之间的通信可以通过队列（Queue）来进行，多个进程一部分向队列里写入数据，一部分从队列里读取数据，从而完成多进程之间的通信问题。

示例：

from multiprocessing import Process, Queue
import random, time, os


def write(q):
    if not q.full():
        for i in range(4):
            q.put(i)
            print('%d was writing data[%d] to queue' % (os.getpid(), i))
            time.sleep(random.random())
    else:
        print('queue is full')
  
def read(q):
    # 等待队列被写入数据
    time.sleep(random.random())
    while True:
        if not q.empty():
            data = q.get()
            print('%d was reading data{%d} from queue' % (os.getpid(), data))
        else:
             print('queue is empty')
             break
    
# 创建通信队列,进程之间,全局变量不共享
q = Queue()
pw = Process(target=write, args=(q,))
pr = Process(target=read, args=(q,))
    
pw.start()
  pr.start()
    
pw.join()
pr.join()
print('end')
    
# 结果为
4640 was writing data[0] to queue
4640 was writing data[1] to queue
4640 was writing data[2] to queue
4641 was reading data{0} from queue
4641 was reading data{1} from queue
4641 was reading data{2} from queue
queue is empty
4640 was writing data[3] to queue
end

由于进程的执行顺序问题，造成了 pr 先于 pw 执行，所以 pr 未读取到数据，pr 进程任务结束，堵塞解开，主进程继续向下运行，最后 pw 任务结束。

进程通信改良

示例：

from multiprocessing import Process, Queue
import random, time, os


def write(q):
    if not q.full():
        for i in range(4):
            q.put(i)
            print('%d was writing data[%d] to queue' % (os.getpid(), i))
            time.sleep(random.random())
    else:
        print('queue is full')

def read(q):
    # 等待队列被写入数据
    time.sleep(random.random())
    while True:
        data = q.get()
        print('%d was reading data{%d} from queue' % (os.getpid(), data))

# 创建通信队列,进程之间,没有全局变量共享之说
q = Queue()
pw = Process(target=write, args=(q,))
pr = Process(target=read, args=(q,))

pw.start()
pr.start()

pw.join()
# pr 进程立刻结束
pr.terminate()
print('end')

# 结果为
12898 was writing data[0] to queue
12898 was writing data[1] to queue
12898 was writing data[2] to queue
12899 was reading data{0} from queue
12899 was reading data{1} from queue
12899 was reading data{2} from queue
12898 was writing data[3] to queue
12899 was reading data{3} from queue
end

线程

概念

线程是进程下的一部分，进程下负责执行代码程序的就是线程，一个进程下会有很多个线程。同样的，一个主线程下面也有很多子线程。

另外，Python 中的线程依据的是 Java 中的线程模型，如果有兴趣的同学可以研究一下。

实现方式

示例：

import threading, time


def run():
    time.sleep(1)
    # currentThread() 返回的是当前的线程对象信息
    print('%s was runing' % threading.currentThread())
    print('current thread\'name: %s' % threading.currentThread().getName())

# 创建一个线程
t = threading.Thread(target=run, args=())

# 启动线程
t.start()

# get_ident 返回的是当前线程对象所在的内存地址（id）,该地址是唯一可以验证线程的数据
# 也可使用 currentThread().getName() 来简单的区分线程
print('current thread\'name: %s' % threading.currentThread().getName())
print('main_thread tid: %s' % threading.get_ident())

# 结果为
current thread'name: MainThread
main_thread tid: 140427132020480
<Thread(Thread-1, started 140427100555008)> was runing
current thread'name: Thread-1

   
 * 线程通信
 
 * 通信队列
 
   通信队列作为相对来说最为安全的线程通信手段，其中`Queue`模块自身拥有所有所需的锁，这使得通信队列中的对象可以安全的在多线程之间共享。
 
   	  这里用常见的「生产者-消费者模型」来介绍。
 		
   	  示例：
 		
   	  ```
 	  import threading, queue, time, random
 	    
 	    
       flag = object()
 	
 	  def producter(q):
 	      for i in range(4):
 	          q.put(i)
 	          print('%s put data{%d} in queue' % (threading.currentThread().getName(), i))
 	          time.sleep(random.random())
 	            
 	      q.put(flag)
 	
 	  def consumer(q):
 	      time.sleep(random.random())
 	      while True:
 	          res = q.get()
 	          if res == flag:
 	              q.put(flag)
 	              break
 	          else:
 	              print('%s get data{%d} from queue' % (threading.currentThread().getName(), res))
 	        
 	  # 创建队列
 	  q = queue.Queue()
 	        
 	  # 创建线程
 	  pro = threading.Thread(target=producter, args=(q,))
 	  con = threading.Thread(target=consumer, args=(q,))
 	        
 	  pro.start()
 	  con.start()
 	        
 	  # 结果为
 	  Thread-1 put data{0} in queue
 	  Thread-1 put data{1} in queue
 	  Thread-2 get data{0} from queue
 	  Thread-2 get data{1} from queue
   	  Thread-1 put data{2} in queue
 	  Thread-2 get data{2} from queue
   	  Thread-1 put data{3} in queue
 	  Thread-2 get data{3} from queue
 	  end
 	    ```
 		
 	  这里有一个细节。在多线程下，当生产者任务完成之后，向队列`queue`里添加了一个特殊对象（终止信号）`flag`，这样当消费者从`queue`中取出任务时，当取到`flag`时，意味着所有任务被取出，并再次将`flag`添加至`queue`中，这样其他线程中的消费者在接收到这个终止信号后，也会得知当前生产者任务已经全部发布。
 		
 	* 轮询
 
   通过为数据操作添加`while`循环判断，迫使线程被迫等待操作。（为了优化等待时间，应在最核心的位置添加判断条件）
 		
 	  示例：
 			
 	  ```
 	  import threading
 		    
 		    
 	  class NewThread(threading.Thread):
 		  flag = 0
 		  g_num = 0
 		    
 		  def __init__(self):
 		      super().__init__()
 		   
 		  def run(self):
 		      print('%s was runing' % threading.currentThread().getName())
 
 	      if self.name == 'Thread-1':
 		          self.add_num()
 		          NewThread.flag = 1
 		      else:
 		          # 轮询
 			      # Thread-2 被迫等待 Thread-1 完成任务之后才能执行
 			      while True:
 			          if NewThread.flag:
 			              self.add_num()
 			              break
 			      
 		  @classmethod
 		  def add_num(cls):
               global g_num
 	          for i in range(1000000):
 		          cls.g_num += 1
 
           print('on the %s, g_num: %d' % (threading.currentThread().getName(), cls.g_num))
 			    
 	  t1 = NewThread()
 	  t2 = NewThread()
 			    
 	  t1.start()
 	  t2.start()
 		    
 	  # 结果为
 	  Thread-1 was runing
       Thread-2 was runing
 	  on the Thread-1, g_num: 1000000
 	  on the Thread-2, g_num: 2000000
 	  ```
 	
 	* 互斥锁
 
   互斥锁是专门为了针对线程安全而设计的一种结构，锁可以强制线程排序，保护线程安全，但是加锁、解锁会消耗系统 CPU 资源。
 	
 	* 互斥锁优化
 	  
 	  示例：
 	  
 	  ```
 	  import threading
 	      
 	      
 	  class NewThread(threading.Thread):
 	      g_num = 0
 	      # 生成锁对象
 	      lock = threading.Lock()
 	      
 	      def __init__(self):
 	          super().__init__()
 	      
 	      def run(self):
 	     	  # 判断当前线程是否上锁，若未上锁，则一直尝试上锁（acquire）直至成功
 	          with NewThread.lock:
 	              print('%s was runing' % self.name)
 	              self.add_num()
 	      
 	      @classmethod
 	      def add_num(cls):
 	          for i in range(1000000):
 	              cls.g_num += 1
                     
               print('on the %s g_num: %d' % (threading.currentThread().getName(), cls.g_num))
       
       t1 = NewThread()
       t2 = NewThread()
   
       t1.start()
       t2.start()
     ```
   ```
 	
   # 结果为
 	  Thread-1 was runing
 	    on the Thread-1 g_num: 1000000
     Thread-2 was runing
 	  on the Thread-2 g_num: 2000000
 	```
 	
 * 死锁问题
   
 	当多线程下出现多个锁，判断条件又是另一个线程里的锁时，就会出现一种情况：当另一个线程任务执行时间过长，或是线程结束，未解锁。当前线程由于迟迟无法上锁，程序始终阻塞，此时就会陷入死锁问题。
 	
 * 死锁问题解决
   
 	* 设置超时时间`threading.Lock().acquire(timeout=3)`只要在上锁时设置超时时间`timeout=`，只要超过时间，线程就会不再等待是否解锁，而是直接运行。但是这种方式很危险，可能会带来大量的等待时间。
 	  * 为每个锁添加一个特殊编号，多线程在获取锁的时候严格按照该编号的升序方式来获取，相当于为线程排序，这样就避免了多线程因为资源争抢，而陷入死锁的可能。	
 	  * [银行家算法](https://zh.wikipedia.org/wiki/%E9%93%B6%E8%A1%8C%E5%AE%B6%E7%AE%97%E6%B3%95)
 	  
 	* 独立全局变量
 	  
 	    多线程之间进行通信，但是又得使得两个线程之间的变量都具有独立性，每个线程从全局变量中得到的数据都不一样。
 	  
 	    三种方法 :
 	  
 	    * 传参
 	    * 字典
 	    * 特殊全局变量（`threading.local()`）
 	  ```
 	  
 	  ```

进程与线程的区别
- 线程和进程的执行顺序都是一样的，都是由操作系统的调度算法决定，不是根据程序的编写顺序来决定。
- 进程是资源分配的单位，而线程是 CPU 调度的单位。
- 进程在主程序结束后，程序立马结束,需要手动利用join()方法使得主程序发生堵塞，来等待子进程。而主线程的任务结束后，程序会等待子线程结束才会结束。故不需要特意使用join()方法来使主线程等待子线程。
- 多进程适合 CPU 密集型，多线程适合 I/O 密集型。
协程
- 概念
  
  线程下的一种，也叫微线程，单线程自身控制切换任务时机，达到多任务的效果。避免了由于系统在处理多进程或者多线程时，切换任务时需要的等待时间。这一点很像操作系统里的中断。
- 实现方式
  - 生成器（yield）
    
    生成器相关内容可看问题 13。
    
    这里以一个简单的「生产者-消费者模型」来解释如何使用生成器实现协程。
    
    示例：
```
import threading  


def producter(c):
    next(c)
    n = 4
    print('%s was running' % threading.currentThread().getName())
    while n:
        print('product data: %d' % n)
        res = c.send(n)
        print(res)
        n -= 1
    print('sale out')
    
def consumer():
    res = ''
  
    print('%s was running' % threading.currentThread().getName())
    while True:
        n = yield res
  
        print('consume data: %d' % n)
        res = '200 OK'
  
print('%s was running' % threading.currentThread().getName())
c = consumer()
  
producter(c)
  
# 结果为
MainThread was running
MainThread was running
MainThread was running
product data: 4
consume data: 4
200 OK
product data: 3
consume data: 3
200 OK
product data: 2
consume data: 2
200 OK
product data: 1
consume data: 1
200 OK
sale out
```
    可以看到，生产者事先不知道消费者具体要消费多少数据，生产者只是一直在生产。而消费者则是利用生成器的中断特性，consumer函数中，程序每一次循环遇到yield关键字就会停下，等待producter函数启动生成器，再继续下一次循环。
    
    在这中间只有一个线程在运行，任务的切换时机由程序员自己控制，避免了由于多线程之间的切换消耗，这样就简单实现了协程。
  - 异步（asyncio）
    
    由于生成器在未来的 Python 3.10 版本中将不在支持协程，而是推荐使用asyncio库，该库适用于高并发。
    
    自己目前不会，就不瞎 BB 了，具体可看文档。
    
    asyncio 中文文档

第四次更新

15.说一说 GIL

前面有提到由于 Python 基于 C 语言编写的解释器中设置了一个 GIL 全局变量锁，该锁使得 Python 的多线程在处理 CPU 计算密集型任务时，同一时刻只能有一个线程在运行，这也是为什么说 Python 的多线程是一个「假性多线程」的原因。

解决 GIL 的办法在处理 CPU 计算密集型任务时，使用多进程 + 协程，发挥计算机多核的威力，而处理 I/O 密集型，则可以使用多线程。

16.说一说 Python 中的垃圾回收机制（GC）

引用计数清零
标记-清除
隔代回收这里有一篇文章可以参考一下。垃圾回收机制

17.说一说 Python 中的函数式编程

lambda

lambda 匿名函数，使用匿名函数可以帮助我们简化代码，且节省程序由于显示创建函数的消耗。

示例：

# 冒号左边是参数， 右边是表达式，lambda 返回的是右边表达式的结果
L2 = lambda x : x * x
print(L2(5))

# 结果为 25

map

map(func，*Iterable)，map 函数通过将可迭代对象传入 func 函数，全部执行。

示例：

# 相当于 [1*1, 2*2, 3*3, 4*4]
L2 = list(map(lambda x: x * x, range(1, 4)))
print(L2)

# 结果为
[1, 4, 9, 16]

reduce

reduce(func， *sequence)，reduce 函数可以将函数 func 迭代调用。

示例：

from functools import reduce


# 相当于 (（1*2)*3)
L2 = reduce(lambda x， y: x * y, range(1, 4))
print(L2)

# 结果为
6

filter

filter(func，*Iterable)，filter 函数通过将可迭代对象当做参数传递给 func 函数，并返回 func 函数中返回结果为 True 的值。

示例：
```
# 相当于 g = [x for x in range(10) if x < 3]
L2 = list(filter(lambda x: x < 3, range(10)))
print(L2)

# 结果为
[0, 1, 2]
```

18.is 和 == 的区别

a is b 比较的是 a 和 b 的「id」是否相同
a == b 比较的是 a 和 b 的「值」是否相同

19.range 和 xrange 的区别

对于现如今的 Python 3.x，这个问题其实已经没有什么意义了，由于其在各大面经中都出现过，这里简单解释下。在 Python 2.x 中，range和xrange最大的区别就是xrange生成的不是一个list，而是一个生成器，这两者的区别在问题 13 已经讲过，这里不在赘述。

Python 3.x 中已经移除了range()方法，并将xrange()方法更名为range()。

20.新式类和旧式类的区别

新式类和旧式类的变化主要讲的是 Python 中类的「继承」问题。

旧式类中，类的继承按照「从左往右，深度优先遍历」的原则。

新式类中，类的继承按照「C3 算法」的原则：如果子类在继承来自不同父类的方法是不一样的时候，会从下而上，先左后右的合并继承方法。如果有一样的方法，则会继承第一个方法然后舍弃另一个相同的方法，接着合并其他不同的方法。解决了旧式类继承中存在的二义性和单调性。

示例：

# 新式类

class B:
    def __init__(self,name):
        self.name = name

    def get_name(self):
        return 'B'

class C:
    def __init__(self,name):
        self.name = name

    def get_name(self):
        return 'C'

class BC(B, C):
    pass

b = B('B')
c = C('C')
bc = BC('C')

print(bc.name)
name = bc.get_name()
print(name)

# 查看 c 在搜索方法时的先后顺序
print(bc.__mro__)

# 结果为
C
B
(<class '__main__.BC'>, <class '__main__.B'>, <class '__main__.C'>, <class 'object'>)

另外，新式类相对于旧式类还多了这么些变化。