1.Python面试题持续更新（重点）

最新推荐文章于 2022-05-06 21:56:10 发布

花开如雨

最新推荐文章于 2022-05-06 21:56:10 发布

阅读量1.6k

点赞数 2

分类专栏：笔记 Python教程资料文章标签： python 机器学习数据库面试

本文链接：https://blog.csdn.net/weixin_43976257/article/details/111559767

版权

笔记同时被 2 个专栏收录

24 篇文章 13 订阅

订阅专栏

Python教程资料

22 篇文章 6 订阅

订阅专栏

1.Python****是如何进行内存管理的？

答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制

一、对象的引用计数机制

Python内部使用引用计数，来保持追踪内存中的对象，所有对象都有引用计数。

引用计数增加的情况：

1，一个对象分配一个新名称

2，将其放入一个容器中（如列表、元组或字典）

引用计数减少的情况：

1，使用del语句对对象别名显示的销毁

2，引用超出作用域或被重新赋值

sys.getrefcount( )函数可以获得对象的当前引用计数

多数情况下，引用计数比你猜测得要大得多。对于不可变数据（如数字和字符串），解释器会在程序的不同部分共享内存，以便节约内存。

二、垃圾回收

1，当一个对象的引用计数归零时，它将被垃圾收集机制处理掉。

2，当两个对象a和b相互引用时，del语句可以减少a和b的引用计数，并销毁用于引用底层对象的名称。然而由于每个对象都包含一个对其他对象的应用，因此引用计数不会归零，对象也不会销毁。（从而导致内存泄露）。为解决这一问题，解释器会定期执行一个循环检测器，搜索不可访问对象的循环并删除它们。

三、内存池机制

Python提供了对内存的垃圾收集机制，但是它将不用的内存放到内存池而不是返回给操作系统。

1，Pymalloc机制。为了加速Python的执行效率，Python引入了一个内存池机制，用于管理对小块内存的申请和释放。

2，Python中所有小于256个字节的对象都使用pymalloc实现的分配器，而大的对象则使用系统的malloc。

3，对于Python对象，如整数，浮点数和List，都有其独立的私有内存池，对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数，用于缓存这些整数的内存就不能再分配给浮点数。

2.什么是lambda函数？它有什么好处?

答：lambda 表达式，通常是在需要一个函数，但是又不想费神去命名一个函数的场合下使用，也就是指匿名函数

lambda函数：首要用途是指点短小的回调函数

lambda [arguments]:expression

>>> a=lambdax,y:x+y

>>> a(3,11)

3.Python里面如何实现tuple和list****的转换？

答：直接使用tuple和list函数就行了，type()可以判断对象的类型

4.请写出一段Python代码实现删除一个list****里面的重复元素

答：

1,使用set函数，set(list)

2，使用字典函数，

>>>a=[1,2,4,2,4,5,6,5,7,8,9,0]

>>> b={}

>>>b=b.fromkeys(a)

>>>c=list(b.keys())

>>> c

3，使用if语句

a=[1,1,2,2,3,4]

b=[]

for x in a:

if x not in b:

b.append(x)

5.编程用sort****进行排序，然后从最后一个元素开始判断

a=[1,2,4,2,4,5,7,10,5,5,7,8,9,0,3]

a.sort()

last=a[-1]

for i inrange(len(a)-2,-1,-1):

if last==a[i]:

del a[i]

else:last=a[i]

print(a)

6.Python****里面如何拷贝一个对象？（赋值，浅拷贝，深拷贝的区别）

答：赋值（=），就是创建了对象的一个新的引用，修改其中任意一个变量都会影响到另一个。

浅拷贝：创建一个新的对象，但它包含的是对原始对象中包含项的引用（如果用引用的方式修改其中一个对象，另外一个也会修改改变）{1,完全切片方法；2，工厂函数，如list()；3，copy模块的copy()函数}

深拷贝：创建一个新的对象，并且递归的复制它所包含的对象（修改其中一个，另外一个不会改变）{copy模块的deep.deepcopy()函数}

1．垃圾回收机制有那些？

答：引用计数、标记-清除、标记-缩并、节点拷贝、分代回收

2.迭代器和生成器是怎么实现的？

答：迭代器是一个带有状态的对象，在调用next()方法的时候返回容器中的下一个值，然后等待下一次被调用；生成器是一种特殊的迭代器，必须包含yeild语句，yeild语句返回一个生成器对象，只有显示或隐式的调用next（）方法时，才会真正执行生成器中的代码。

7.介绍一下except****的用法和作用？

答：try…except…except…[else…][finally…]

执行try下的语句，如果引发异常，则执行过程会跳到except语句。对每个except分支顺序尝试执行，如果引发的异常与except中的异常组匹配，执行相应的语句。如果所有的except都不匹配，则异常会传递到下一个调用本代码的最高层try代码中。

try下的语句正常执行，则执行else块代码。如果发生异常，就不会执行

如果存在finally语句，最后总是会执行。

8.Python中pass****语句的作用是什么？

答：pass语句不会执行任何操作，一般作为占位符或者创建占位程序，whileFalse:pass

**9.介绍一下Python下range()**函数的用法？

答：列出一组数据，经常用在for _ in range()循环中

10.如何用Python****来进行查询和替换一个文本字符串？

答：可以使用re模块中的sub()函数或者subn()函数来进行查询和替换，

格式：sub(replacement, string[,count=0])（replacement是被替换成的文本，string是需要被替换的文本，count是一个可选参数，指最大被替换的数量）

>>> import re

>>>p=re.compile(‘blue|white|red’)

>>>print(p.sub(‘colour’,'blue socks and red shoes’))

colour socks and colourshoes

>>>print(p.sub(‘colour’,'blue socks and red shoes’,count=1))

colour socks and redshoes

subn()方法执行的效果跟sub()一样，不过它会返回一个二维数组，包括替换后的新的字符串和总共替换的数量

**11.Python里面match()和search()**的区别？

答：re模块中match(pattern,string[,flags]),检查string的开头是否与pattern匹配。

re模块中research(pattern,string[,flags]),在string搜索pattern的第一个匹配值。

>>>print(re.match(‘super’, ‘superstition’).span())

(0, 5)

>>>print(re.match(‘super’, ‘insuperable’))

None

>>>print(re.search(‘super’, ‘superstition’).span())

(0, 5)

>>>print(re.search(‘super’, ‘insuperable’).span())

(2, 7)

**12.用Python匹配HTML tag的时候，<.*>和<.*?>**有什么区别？

答：术语叫贪婪匹配( <.> )和非贪婪匹配(<.?> )

例如:

test

<.*> :

test

<.*?> :

13.Python****里面如何生成随机数？

答：random模块

随机整数：random.randint(a,b)：返回随机整数x,a<=x<=b

random.randrange(start,stop,[,step])：返回一个范围在(start,stop,step)之间的随机整数，不包括结束值。

随机实数：random.random( ):返回0到1之间的浮点数

random.uniform(a,b):返回指定范围内的浮点数。

14.有没有一个工具可以帮助查找python的bug****和进行静态的代码分析？

答：PyChecker是一个python代码的静态分析工具，它可以帮助查找python代码的bug, 会对代码的复杂度和格式提出警告

Pylint是另外一个工具可以进行codingstandard检查

15.如何在一个function****里面设置一个全局的变量？

答：解决方法是在function的开始插入一个global声明：

def f()

global x

**16.**单引号，双引号，三引号的区别

答：单引号和双引号是等效的，如果要换行，需要符号(),三引号则可以直接换行，并且可以包含注释

如果要表示Let’s go 这个字符串

单引号：s4 = ‘Let\’s go’

双引号：s5 = “Let’s go”

s6 = ‘I realy like“python”!’

这就是单引号和双引号都可以表示字符串的原因了

17**、Python中核心的数据类型？**

答：数值型(整形int，浮点型,float，bool类型,空值None)，字符串，列表，元组，字典，集合

其中可变的：列表，字典，集合

不可变的：数值型，字符串，元组

18**、一行代码实现对列表a中的偶数位置元素进行加3后求和？**

答：sums = sum(map(lambda x : x+3, a[1::2]))

19**、List = [-2, 1, 3, -6]，如何实现以绝对值大小从小到大将** List 中内容排序**。**

答：sorted(List,key=abs)

追加需求：列表的sort方法和sorted的区别是什么？

答：sort()是list的方法，改变list对象的顺序, 默认从小到大排序, 默认属性 reverse=Flase

sorted是Python的内置方法，使用iterable对象，返回值是新列表，不影响原来的iterable的顺序

20**、Python中的变量作用域****(变量查找顺序)****？**

答：LEGB

local局部变量–>enclosed闭包作用域—>Global全局变量—>built-in变量

21**、描述Python GIL的概念，以及它对Python多线程的影响？**

答：Python语言和GIL没有半毛钱关系。仅仅是由于历史原因在Cpython虚拟机(解释器)，难以移除GIL。

GIL：全局解释器锁。每个线程在执行的过程都需要先获取GIL，保证同一时刻只有一个线程可以执行字节码。

线程释放GIL锁的情况：

在IO操作等可能会引起阻塞的system call之前,可以暂时释放GIL,但在执行完毕后,必须重新获取GIL

Python 3.x使用计时器（执行时间达到阈值后，当前线程释放GIL）或Python 2.x，tickets计数达到100

Python使用多进程是可以利用多核的CPU资源的。

多线程爬取比单线程性能有提升，因为遇到IO阻塞会自动释放GIL锁

22**、用CSS如何隐藏一个元素？**

答、dispaly:none

23**、模块有很多属性和方法，现用一句话打印出os模块下所有的方法名**

答：Import os

Dir(os)

24**、****a = {“name”:”jack”,”age”:30,”skill”:”python”}**现在需要生成字符串：

name=jack|age=30|skill=python

请用一行代码实现：

答：s = ‘|’.join([str(x)+’=’+str(a[x]) for x in a])

25**、mysql查询大小写敏感吗？**

不区分关键字大小写

26**、NOW() **和**CURRENT_DATE()**有什么区别？

Now()获取当前时期+时间

CURRENT_DATE()获取当前日期

27**、说一说你知道的HTTP的状态码？**

答：

2开头（请求成功）表示成功处理了请求的状态代码。

· 200 （成功）服务器已成功处理了请求。通常，这表示服务器提供了请求的网页。

· 201 （已创建）请求成功并且服务器创建了新的资源。

· 202 （已接受）服务器已接受请求，但尚未处理。

· 203 （非授权信息）服务器已成功处理了请求，但返回的信息可能来自另一来源。

· 204 （无内容）服务器成功处理了请求，但没有返回任何内容。

· 205 （重置内容）服务器成功处理了请求，但没有返回任何内容。

· 206 （部分内容）服务器成功处理了部分 GET 请求。

3开头（请求被重定向）表示要完成请求，需要进一步操作。通常，这些状态代码用来重定向。

· 300 （多种选择）针对请求，服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作，或提供操作列表供请求者选择。

· 301 （永久移动）请求的网页已永久移动到新位置。服务器返回此响应（对 GET 或 HEAD 请求的响应）时，会自动将请求者转到新位置。

· 302 （临时移动）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来进行以后的请求。

· 303 （查看其他位置）请求者应当对不同的位置使用单独的 GET 请求来检索响应时，服务器返回此代码。

· 304 （未修改）自从上次请求后，请求的网页未修改过。服务器返回此响应时，不会返回网页内容。

· 305 （使用代理）请求者只能使用代理访问请求的网页。如果服务器返回此响应，还表示请求者应使用代理。

· 307 （临时重定向）服务器目前从不同位置的网页响应请求，但请求者应继续使用原有位置来进行以后的请求。

4开头（请求错误）这些状态代码表示请求可能出错，妨碍了服务器的处理。

· 400 （错误请求）服务器不理解请求的语法。

· 401 （未授权）请求要求身份验证。对于需要登录的网页，服务器可能返回此响应。

· 403 （禁止）服务器拒绝请求。

· 404 （未找到）服务器找不到请求的网页。

· 405 （方法禁用）禁用请求中指定的方法。

· 406 （不接受）无法使用请求的内容特性响应请求的网页。

· 407 （需要代理授权）此状态代码与 401（未授权）类似，但指定请求者应当授权使用代理。

· 408 （请求超时）服务器等候请求时发生超时。

· 409 （冲突）服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。

· 410 （已删除）如果请求的资源已永久删除，服务器就会返回此响应。

· 411 （需要有效长度）服务器不接受不含有效内容长度标头字段的请求。

· 412 （未满足前提条件）服务器未满足请求者在请求中设置的其中一个前提条件。

· 413 （请求实体过大）服务器无法处理请求，因为请求实体过大，超出服务器的处理能力。

· 414 （请求的 URI 过长）请求的 URI（通常为网址）过长，服务器无法处理。

· 415 （不支持的媒体类型）请求的格式不受请求页面的支持。

· 416 （请求范围不符合要求）如果页面无法提供请求的范围，则服务器会返回此状态代码。

· 417 （未满足期望值）服务器未满足”期望”请求标头字段的要求。

5开头（服务器错误）这些状态代码表示服务器在尝试处理请求时发生内部错误。这些错误可能是服务器本身的错误，而不是请求出错。

· 500 （服务器内部错误）服务器遇到错误，无法完成请求。

· 501 （尚未实施）服务器不具备完成请求的功能。例如，服务器无法识别请求方法时可能会返回此代码。

· 502 （错误网关）服务器作为网关或代理，从上游服务器收到无效响应。

· 503 （服务不可用）服务器目前无法使用（由于超载或停机维护）。通常，这只是暂时状态。

· 504 （网关超时）服务器作为网关或代理，但是没有及时从上游服务器收到请求。

· 505 （HTTP 版本不受支持）服务器不支持请求中所用的 HTTP 协议版本。

28**、简述http和https的区别****?**

答：https就是http和TCP之间有一层SSL层，这一层的实际作用是防止钓鱼和加密。防止钓鱼通过网站的证书，网站必须有CA证书，证书类似于一个解密的签名。另外是加密，加密需要一个密钥交换算法，双方通过交换后的密钥加解密。

HTTPS和HTTP的区别：

https协议需要到ca申请证书，一般免费证书很少，需要交费。

http是超文本传输协议，信息是明文传输，https 则是具有安全性的ssl加密传输协议。

http和https使用的是完全不同的连接方式用的端口也不一样，前者是80，后者是443。

http的连接很简单，是无状态的。

HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议，要比http协议安全。

29**、你正在开发注册页面，用户会输入一个邮箱，请写出校验邮箱合法性的正则表达式**

答：

¹+@[a-zA-Z0-9_-]+(.[a-zA-Z0-9_-]+)+$

30**、***args,*kwargs***是什么意思？

答：*args表示任何多个无名参数，它是一个tuple

**kwargs表示关键字参数，它是一个dict

31**、多进程中如果有一个进程死掉，怎么发现和处理**

答，用log日志模块，监控，或在每个进程下面判断用print打印。

32**、写一个生成器** 简单的生成器函数

defrev_str(my_str):

length=len(my_str)

fori in range(length-1,-1,-1):

yieldmy_str[i]

for char in rev_str(“hello”):

print(char) #olleh

33**、MySQL mongodbredis数据库的端口都是什么？**

答：MySQL:3306 mongodb:28017 redis:6379

34、git和svn****之间的区别

答：

(1).GIT是分布式的，SVN不是：

这是GIT和其它非分布式的版本控制系统，例如SVN，CVS等，最核心的区别。如果你能理解这个概念，那么你就已经上手一半了。需要做一点声明，GIT并不是目前第一个或唯

一的分布式版本控制系统。还有一些系统，例如Bitkeeper, Mercurial等，也是运行在分布式模式上的。但GIT在这方面做的更好，而且有更多强大的功能特征。

GIT跟SVN一样有自己的集中式版本库或服务器。但，GIT更倾向于被使用于分布式模式，也就是每个开发人员从中心版本库/服务器上chect out代码后会在自己的机器上克隆

一个自己的版本库。可以这样说，如果你被困在一个不能连接网络的地方时，就像在飞机上，地下室，电梯里等，你仍然能够提交文件，查看历史版本记录，创建项目分支，

等。对一些人来说，这好像没多大用处，但当你突然遇到没有网络的环境时，这个将解决你的大麻烦。

同样，这种分布式的操作模式对于开源软件社区的开发来说也是个巨大的恩赐，你不必再像以前那样做出补丁包，通过email方式发送出去，你只需要创建一个分支，向项目

团队发送一个推请求。这能让你的代码保持最新，而且不会在传输过程中丢失。GitHub.com就是一个这样的优秀案例。

(2).GIT把内容按元数据方式存储，而SVN是按文件：

所有的资源控制系统都是把文件的元信息隐藏在一个类似.svn,.cvs等的文件夹里。如果你把.git目录的体积大小跟.svn比较，你会发现它们差距很大。因为,.git目录是处于

你的机器上的一个克隆版的版本库，它拥有中心版本库上所有的东西，例如标签，分支，版本记录等。

(3).GIT分支和SVN的分支不同：

分支在SVN中一点不特别，就是版本库中的另外的一个目录。如果你想知道是否合并了一个分支，你需要手工运行像这样的命令svnpropgetsvn:mergeinfo，来确认代码是否

被合并。感谢Ben同学指出这个特征。所以，经常会发生有些分支被遗漏的情况。

然而，处理GIT的分支却是相当的简单和有趣。你可以从同一个工作目录下快速的在几个分支间切换。你很容易发现未被合并的分支，你能简单而快捷的合并这些文件。

(4).GIT没有一个全局的版本号，而SVN有：

目前为止这是跟SVN相比GIT缺少的最大的一个特征。你也知道，SVN的版本号实际是任何一个相应时间的源代码快照。我认为它是从CVS进化到SVN的最大的一个突破。因为GIT

和SVN从概念上就不同，我不知道GIT里是什么特征与之对应。如果你有任何的线索，请在评论里奉献出来与大家共享。

更新：有些读者指出，我们可以使用GIT的SHA-1来唯一的标识一个代码快照。这个并不能完全的代替SVN里容易阅读的数字版本号。但，用途应该是相同的。

(5).GIT的内容完整性要优于SVN：

GIT的内容存储使用的是SHA-1哈希算法。这能确保代码内容的完整性，确保在遇到磁盘故障和网络问题时降低对版本库的破坏。这里有一个很好的关于GIT内容完整性的讨论

35**、Django采用的是什么框架模式****?**

答：django是一种重量级的python web框架，采用的mtv框架模式

Tornado 是一种轻量级的框架，处理高并发,其拥有异步非阻塞IO的处理方式。

36**、简单说一下IO多路复用**

答：多路复用IO也是阻塞IO，只是阻塞的方法是select/poll/epoll。select/epoll的好处就在于单个process就可以同时处理多个网络连接的IO。它的基本原理是select/epoll这

个函数会不断轮询所负责的IO操作，当某个IO操作有数据到达时，就通知用户进程。然后由用户进程去操作IO

37**、对Flask的了解？**

Flask 是一种具有平缓学习曲线和庞大社区支持的微框架，利用它可以构建大规模的web应用。是搭建社区平台的神器之一。

利用它可以构建大规模的web应用。学习上手Flask非常轻松，但要深入理解却并不容易。

使用MVC（模型-视图-控制器）架构

37**、C语言下的int占多少字节？64位呢？**

64位系统下C语言中int还是占4字节，32位，与32位系统中没有区别！

38**、怎么判断session过期**

(1).session其实就是一个Map，键=值对，通过session.getAttribute(“name”);获得session中设置的参数

(2).session的过期时间是从什么时候开始计算的？是从一登录就开始计算还是说从停止活动开始计算？

答：从session不活动的时候开始计算，如果session一直活动，session就总不会过期。

从该Session未被访问,开始计时; 一旦Session被访问,计时清0;

(3).设置session的失效时间

(4).request.getSeesion(boolean）方法，一下子让我恍然大悟。这个方法里面传了一个boolean值，这个值如果是true，那么如果当前的request的session不可用，那么就

创建新的会话，如果存在就返回当前的会话。如果参数是false，那么在request的当前会话不存在的时候就返回null。

39**、什么是进程，什么是线程？**

进程：是资源分配的最小单位，创建和销毁开销较大，程序文件的一次执行；

线程：是CPU调度的最小单位，开销小，切换速度快；

计算CPU密集型程序推荐使用多进程

IO密集型程序适合使用多线程

40**、Mysql可以有哪些优化**

* 增加索引

* 少用 * in not in

* 选择合适的引擎INNODB 写操作 MYISAM读操作

* 尽量避免使用null 条件判断尽量少or

(1)、选取最适用的字段属性

MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表

中字段的宽度设得尽可能小。

(2)、使用连接（JOIN）来代替子查询(Sub-Queries)

(3)、使用联合(UNION)来代替手动创建的临时表

(4)、事务

BEGIN; INSERT INTO salesinfo SET CustomerID=14; UPDATE inventory SET Quantity=11 WHERE item=‘book’; COMMIT;

事务的另一个重要作用是当多个用户同时使用相同的数据源时，它可以利用锁定数据库的方法来为用户提供一种安全的访问方式，这样可以保证用户的操作不被其它的用户所

干扰。

(5)、锁定表

LOCK TABLE inventory WRITE SELECT Quantity FROM inventory WHERE Item=‘book’;

…

UPDATE inventory SET Quantity=11 WHERE Item=‘book’; UNLOCKTABLES

(6)、使用外键

(7)、使用索引

索引是提高数据库性能的常用方法，它可以令数据库服务器以比没有索引快得多的速度检索特定的行，尤其是在查询语句当中包含有MAX(),MIN()和ORDERBY这些命令的时候，

性能提高更为明显。

(8)、优化的查询语句

41.Python中split和Join 函数的用法与区别

答：

.join()

join将容器对象拆分并以指定的字符将列表内的元素(element)连接起来，返回字符串（注：容器对象内的元素须为字符类型）

1 2 3 4	>>> a = [‘no’,‘pain’,‘no’,‘gain’] 　>>> '_ '.join(a) 　‘no_pain_no_gain’ 　>>>

注：容器对象内的元素须为字符类型

1 2 3 4 5 6 7	>>> b = [‘I’,‘am’,‘no’,1] 　　>>> ‘’.join(b) 　　Traceback (most recent call last): 　　File “<pyshell#32>”, line 1, in 　　'’.join(b) 　　TypeError: sequence item 3: expected string, int found 　　>>>

dict是以Key值作连接

1 2 3 4	>>> L = {‘p’:‘P’,‘y’:‘Y’,‘t’:‘T’,‘h’:‘H’,‘o’:‘O’,‘n’:‘N’} 　　>>> ‘_’.join(L) 　　‘h_o_n_p_t_y’　　　　#dict 的无序性，使元素随机连接。set 同理　　>>>

.split()

与join相反，split以指定的字符将字符串分割为单个元素(字符类型)并加入list中，返回一个List

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

>>> a = ‘no_pian_no_gain’ 　　　>>> a.split(’’) 　　　[‘no’, ‘pian’, ‘no’, ‘gain’] 　　　>>> 　　　split是可以设定切割多少个字符的　　　>>> a = ‘no_pian_no_gain’ 　　　>>> a.split(’’,2) 　　　[‘no’, ‘pian’, ‘no_gain’] 　　　>>> a.split(’’,1) 　　　[‘no’, ‘pian_no_gain’] 　　　>>> a.split(’’,0) 　　　[‘no_pian_no_gain’] 　　　>>> a.split(’_’,-1) 　　　[‘no’, ‘pian’, ‘no’, ‘gain’] 　　　>>>

可见split(’’)与split(’’,-1)返回的结果是一致的

42、Python的核心数据类型？

答：数值型(整型，浮点型，复数，布尔型(bool))

字符串str

列表list

元组 tuple

集合 set

字典 dict

不可变的数据类型: 数值型，字符串，元组

可变的类型: 列表字典集合

43、简述pass语句，return语句,break语句,continue语句?

答：pass语句，用来填充语法空白

return语句，结束当前函数的执行，返回到函数调用的地方，同时返回一个对象的引用关系

break语句，用于循环中，用来终止当前循环语句的执行

continue 用于循环语句中，不再执行本次循环内continue之后的语句，重新开始下一次循环

**44、**简述深拷贝和浅拷贝的区别？

答：

1、浅拷贝：

使用copy.copy,它可以进行对象的浅拷贝(shallow copy),它复制了对象,但对于对象中的元素,依然使用引用（换句话说修改拷贝对象元素，则被拷贝对象元素也被修改

2、深拷贝：

使用copy.deepcopy，它可以进行深拷贝，不仅拷贝了对象，同时也拷贝了对象中的元素，获得了全新的对象，与被拷贝对象完全独立，但这需要牺牲一定的时间和空间。

45、如何在function****中设置一个全局变量

答：使用global修饰变量名

46**、描述yield使用场景****?**

答：带有yield的函数不再是一个普通的函数，Python解释器会其视为一个 generator，所以yield的作用就是把一个函数变成一个生成器

46、生成1-10****之间的随机整数

答： import random

random.randint(1, 11)

47、什么是单例，怎么理解单例?

答：最简单的单例就是一个模块:

Class foo(object):

def fin(self):

Pass

A=foo()

单例模式(SingLetonPattern)是一种常用的软件设计模式，该模式的主要目的是确保某一个类只有一个实例存在，当你希望在整个系统中，某个类只能出现一个实例时，单例对象就能派上用场

把你的单例的代码保存在一个py文件当中，要使用时，直接在本文件中导入其他文件的对象，这个对象即是单例模式的对象

**48、**什么是多态？

答：多态性是指具有不同功能的函数可以使用相同的函数名，这样就可以用一个函数名调用不同内容的函数，在面对对象方法中一般是这样表述多态性：向不同的对象发送同一条消息，不同的对象在接收时会产生不同的行为（即方法）。也就是说，每个对象可以用自己的方式去响应共同的消息。所谓消息，就是调用函数，不同的行为就是指不同的实现，即执行不同的函数

**49、**用自己的话来讲述什么是面向对象编程

答：面向对象的程序设计语言必须有描述对象及其相互之间关系的语言成分。这些程序设计语言可以归纳为以下几类：系统中一切事物皆为对象；对象是属性及其操作的封装体；对象可按其性质划分为类，对象成为类的实例；实例关系和继承关系是对象之间的静态关系；消息传递是对象之间动态联系的唯一形式，也是计算的唯一形式；方法是消息的序列。

**50、**python2 和 python3 的区别

答：Py3.0运行 pystone benchmark的速度比Py2.5慢30%。Guido认为Py3.0有极大的优化空间，在字符串和整形操作上可
以取得很好的优化结果。
Py3.1性能比Py2.5慢15%，还有很大的提升空间。
2.编码
Py3.X源码文件默认使用utf-8编码，这就使得以下代码是合法的：
>>> 中国 = ‘china’
>>>print(中国)
china
\3. 语法
1）去除了<>，全部改用!=
2）去除``，全部改用repr()
3）关键词加入as 和with，还有True,False,None
4）整型除法返回浮点数，要得到整型结果，请使用//
5）加入nonlocal语句。使用noclocal x可以直接指派外围（非全局）变量

1、类方法，静态方法区别

答：一、先是在语法上面的区别:

1、静态方法不需要传入self参数，类成员方法需要传入代表本类的cls参数；

2、静态方法是无妨访问实例变量和类变量的，类成员方法无法访问实例变量但是可以访问类变量

二、使用的区别：

由于静态方法无法访问类属性，实例属性，相当于一个相对独立的方法，跟类其实并没有什么关系。这样说来，静态方法就是在类的作用域里的函数而已。

2、登录一个网站发生的过程，越详细越好，

1、利用DNS协议进行域名解析

2、建立tcp协议三次握手过程

3、?客户端发出访问网站相应页面请求（发出http协议请求报文）

4、系统架构部署情况

5、服务端发出响应访问页面的请求信息（发出http协议响应报文）

6、断开tcp协议四次挥手过程

5 说一下HTTP协议

答：HTTP协议，全称HyperText Transfer Protocol，中文名为超文本传输协议，是互联网中最常用的一种网络协议。HTTP的重要应用之一是WWW服务。设计HTTP协议最初目的

就是提供一种发布和接收HTML（一种页面标记语言）页面的方法（请求返回）。

HTTP协议是互联网上常用的通信协议之一。它有很多的应用，但最流行的就是用于Web浏览器和Web服务器之间的通信，即WWW应用或称Web应用。

WWW，全称World Wide Web，常称为Web，中文译为“万维网”。它是目前互联网上最受用户欢迎的信息服务形式。HTTP协议的WWW服务应用的默认端口为80（端口的概念），

另外的一个加密的WWW服务应用https的默认端口为443，主要用于网银，支付等和钱相关的业务。当今，HTTP服务，WWW服务，Web服务三者的概念已经混淆了，都是指当下最常见的网站服务应用。

6 MySQL如何优化

1.优化索引、SQL语句、分析慢查询；

2.设计表的时候严格按照数据库的设计范式来设计数据库；

3.我们还可以将我们的业务架构进行缓存，静态化和分布式；

4.不用全文索引，使用Xunsearch,ES或者云服务器上的索引；

5.如果效率还是不够好，可以采用主从方式将数据读写分离；

6.可以加上memcached缓存，将经常被访问到但不经常变化的数据放至memcached缓存服务器里面，这样的话能够节约磁盘I/O；

7.还可以优化硬件，在硬件层面，我们可以使用更好的一些硬盘（固态硬盘），使用一些磁盘阵列技术（raid0，raid1，raid5）?

- raid0：最简单的（两块硬件相加100G+100G=200G）?

- raid1：镜像卷，把同样的数据下两份。可以随即从A/B里面读取，效率更高，硬盘坏了一块数据也不会丢失；?

- raid5:3块硬盘，坏了一块，另外两块也能工作。

8.如果还是慢，先不要切分表，可以使用MySQL内部自带的表分区技术，将数据分成不同的文件，这样能够让磁盘在读取的时候效率更高；

9.可以做垂直分表，将不经常用读的数据放到另外一个表里去（节约磁盘I/O）；

10.数据量特别大，我们优化起来会很困难，这时可以使用数据库中间件的方式，将数据进行分库分表分机器。（原理：数据路由）；

11.此外，还可以采用一些更快的存储方式，例如NoSQL存储一些我们需要经常访问到的数据（数据库取出来后，再到NoSQL中取出一些其他数据）；

12.此外还有一些表引擎选择，参数优化还有些相关的小技巧都是优化MySQL的方式；

一、选择题

\1. 下列哪个语句在Python中是非法的？（B）

A．x=y=z=1 B. x=(y=z+1)

C. x,y=y,x D. x+=y

\2. 下面哪个不是Python合法的标识符（B）

A . int32 B. 40XL C.self D. name

3 python不支持的数据类型（A）

A .char B.int C.float D. list

\4. python序列类型不包括（C）

A.列表 B.字符串 C.字典 D.元组

\5. 下列不是元组类型的是（C）

A.a=(1,2) B. a=tuple([1,2]) C . a=(1) D. a=”1”,”2”,”3”,”4”

\6. 下列等式中输出为False的是（C）

A. 1+1 is 2 B. 999+1 is 1000 C. 2.03.0 ==3.02.0 D. type(bool)==type(int)

\7. 有两个元祖t1=(1,2),t2=(3,[4]),下列操作有误的是（B）

A. t3=t1+t2 B. t2[0]=5 C. t2[1].append(5) D. t1[:5]

8.下列哪种捕获异常的方式是错误的（D）

A. try….exxept…else B. try….finally…

C. try….exxept… D. try….raise

二、填空题

9.请填写下列方法运行的代码：

def f(x,l=[]):

fori in range(x):l.append(i*i)

print(l)

print(f(3,[3,2,1]))的结果是[3, 2, 1, 0, 1, 4]

None

print(f(3))的结果是[0, 1, 4]

None

10.如何将字符串str=”hello world”反向输出，请用最简单最简洁的语句输出：str[::-1]

11.有一个列表a=[i for i in range(10)]请写出下列代码的输出结果

sums=sum(map(lambda x: x+3,a[1::2]))

print(sums)—40

12.写出下列函数调用结果：

my_list=[lambda:i for i in range(5)]

for l in my_list:print(l())

结果是(换行用\t)4\t4\t\4\t4\t4

13.有一个列表b=[2,4,5,6]执行了下列操作

fori in b:

if not i%2:

b.remove(i)

print(b)结果是[4,5]

三、简答题

14.详细说说tuple、list、dict的用法，它们的特点

列表，元组，字典，都是可迭代对象

列表和元组都是序列，列表是可变的序列, 元组是不可变的序列；列表可以通过索引改变列表的元素，元组不可以；列表可以通过切片赋值插入和删除数据，也可以改变数据，元组不可以

字典是可变的容器，字典可以存储任意类型的数据；字典中的数据都是用键进行索引的；字典的存储是无序的；字典中的数据是以键-值（key-value）对的形式进行存储的；字典的键不能重复，且只能用不可变类型作为字典的键。

15.用自己的话说明迭代器和生成器，它们之间的关系

迭代器：指的是一个重复的过程，每一次重复称为一次迭代，并且每一次重复的结果是下一次重复的初始值

生成器：只要在函数体内出现yield关键字，那么再执行函数就不会执行函数代码，会得到一个结果，该结果就是生成器

16.什么是lambda函数？它有什么好处

lambda 表达式（又称匿名函数）

作用：创建一个匿名函数对象,同def类似，但不提供函数名

语法说明：

\1. lambda 只是一个表达式 ,它用来创建一个函数对象

\2. 当lambda表达式执行时，返回的是冒号(:)后的表达式的值

\3. lambda表达式创建的函数只能包含一条语句

\4. lambda比函数简单，且可以随时创建和销毁，有利于减少程序的偶合度

17.Python里赋值（=）,浅拷贝，深拷贝的区别

答：赋值（=），就是创建了对象的一个新的引用，修改其中任意一个变量都会影响到另一个。浅拷贝：创建一个新的对象，但它包含的是对原始对象中包含项的引用（如果用引用的方式修改其中一个对象，另外一个也会修改改变）{1,完全切片方法；2，工厂函数，如 list()；3，copy 模块的 copy()函数} 深拷贝：创建一个新的对象，并且递归的复制它所包含的对象（修改其中一个，另外一个不会改变）{copy 模块的deep.deepcopy()函数}

18.观察输出，用自己的话解释*args,**kwargs这两个参数是什么意思，我问为什么使用它？

def func(*args,**kwargs):

print(args,kwargs)

l=[1,2,3]

t=(4,5,6)

d={‘a’:7,‘b’:8,‘c’:9}

func(1,2,3)#(1, 2, 3) {}

func(a=1,b=2,c=3)#() {‘a’: 1, ‘c’: 3, ‘b’: 2}

func=(1,2,3,a=1,b=2,c=3) #(1,2,3) {‘a’:1,‘c’:3,‘b’:2}

func(*l,**d)#(1, 2, 3) {‘a’: 7, ‘c’: 9, ‘b’: 8}

func(l,2,*t)#([1, 2, 3], 2, 4, 5, 6) {}

func(q=‘winning’,**d)#() {‘a’: 7, ‘c’: 9, ‘b’: 8, ‘q’: ‘winning’}

答案：如果我们不确定要往函数中传入多少个参数，或者我们想往函数中以列表和元组的形式传参数时，那就使要用args；如果我们不知道要往函数中传入多少个关键词参数，或者想传入字典的值作为关键词参数时，那就要使用**kwargs。args和kwargs这两个标识符是约定俗成的用法，你当然还可以用bob和**billy，但是这样就并不太妥。

四、编程题

19.将一个正整数分解质因数。例如输入90，打印90=233*5

n = num = int(input(‘请输入一个数字：’)) #用num保留初始值

f = [] #存放质因数的列表

for j in range(int(num/2)+1): #判断次数仅需该数字的一半多1次

fori in range(2, n):

t = n % i #i不能是n本身

if t == 0: #若能整除

f.append(i) #则表示i是质因数

n = n//i #除以质因数后的n重新进入判断，注意应用两个除号，使n保持整数

break #找到1个质因数后马上break，防止非质数却可以整除的数字进入质因数列表

if len(f) == 0: #若一个质因数也没有

print(‘该数字没有任何质因数。’)

else: #若至少有一个质因数

f.append(n) #此时n已被某个质因数整除过，最后一个n也是其中一个质因数

f.sort() #排下序

print(’%d=%d’ % (num, f[0]), end=’’)

fori in range(1,len(f)):

print(’*%d’ % f[i], end=’’)

20.编写一个队列类Queue(先进先出)，实现队列enqueue,出列dequeue,

队列有多少个元素size,添加一个队列extend,清空队列clear

是否为空isEmpty,打印全部元素等方法showinfo(该队列可以初始时赋值)

1、解释什么是栈溢出，在什么情况下可能出现

2、简述CPython的内存管理机制

答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制 Python 内部使用引用计数，来保持追踪内存中的对象，所有对象都有引用计数。引用计数增加的情况： 1，一个对象分配一个新名称 2，将其放入一个容器中（如列表、元组或字典）引用计数减少的情况： 1，使用 del 语句对对象别名显示的销毁 2，引用超出作用域或被重新赋值sys.getrefcount( )函数可以获得对象的当前引用计数多数情况下，引用计数比你猜测得要大得多。对于不可变数据（如数字和字符串），解释器会在程序的不同部分共享内存，以便节约内存。二、垃圾回收 1，当一个对象的引用计数归零时，它将被垃圾收集机制处理掉。 2，当两个对象 a 和 b 相互引用时，del 语句可以减少 a 和 b 的引用计数，并销毁用于引用底层对象的名称。然而由于每个对象都包含一个对其他对象的应用， Python 开发学院整理-面试题 18-AID 因此引用计数不会归零，对象也不会销毁。（从而导致内存泄露）。为解决这一问题，解释器会定期执行一个循环检测器，搜索不可访问对象的循环并删除它们。三、内存池机制 Python 提供了对内存的垃圾收集机制，但是它将不用的内存放到内存池而不是返回给操作系统。 1，Pymalloc机制。为了加速 Python 的执行效率，Python 引入了一个内存池机制，用于管理对小块内存的申请和释放。 2，Python 中所有小于 256 个字节的对象都使用pymalloc实现的分配器，而大的对象则使用系统的malloc。 3，对于 Python 对象，如整数，浮点数和 List，都有其独立的私有内存池，对象间不共享他们的内存池。也就是说如果你分配又释放了大量的整数，用于缓存这些整数的内存就不能再分配给浮点数。

3、列举你知道的Python的魔法方法及用途

new(cls[, …])	1. new 是在一个对象实例化的时候所调用的第一个方法 2. 它的第一个参数是这个类，其他的参数是用来直接传递给 init 方法 3. new 决定是否要使用该 init 方法，因为 new 可以调用其他类的构造方法或者直接返回别的实例对象来作为本类的实例，如果 new 没有返回实例对象，则 init 不会被调用 4. new 主要是用于继承一个不可变的类型比如一个 tuple 或者 string
init(self[, …])	构造器，当一个实例被创建的时候调用的初始化方法
del(self)	析构器，当一个实例被销毁的时候调用的方法
call(self[, args…])	允许一个类的实例像函数一样被调用：x(a, b) 调用x.call(a, b)
len(self)	定义当被len() 调用时的行为
repr(self)	定义当被repr() 调用时的行为
str(self)	定义当被str() 调用时的行为

getattr(self, name)	定义当用户试图获取一个不存在的属性时的行为
getattribute(self, name)	定义当该类的属性被访问时的行为
setattr(self, name, value)	定义当一个属性被设置时的行为
delattr(self, name)	定义当一个属性被删除时的行为
len(self)	定义当被len() 调用时的行为（返回容器中元素的个数）
getitem(self, key)	定义获取容器中指定元素的行为，相当于self[key]
setitem(self, key, value)	定义设置容器中指定元素的行为，相当于self[key] = value
delitem(self, key)	定义删除容器中指定元素的行为，相当于 del self[key]
iter(self)	定义当迭代容器中的元素的行为
reversed(self)	定义当被 reversed() 调用时的行为
contains(self, item)	定义当使用成员测试运算符（in 或 not in）时的行为

重载运算……

4、已知以下list：

list1=[{‘mm’:2},{‘mm’:1},{‘mm’:4},{‘mm’:3},{‘mm’:3}]

1．把list1中的元素按mm的值排序

2．获取list1中第一个mm的值等于x的元素

3． List1[::4]输出的是什么

[{‘mm’: 2}, {‘mm’: 3}]

5、简述你对GIL的理解

线程全局锁(Global Interpreter Lock),即 Python 为了保证线程安全而采取的独立线程运行的限制,说白了就是一个核只能在同一时间运行一个线程.

6、简述以下内置函数的用法

7、简述多线程，多进程，协程之间的区别

进程：是资源分配的最小单位，创建和销毁开销较大；

线程：是CPU调度的最小单位，开销小，切换速度快；

协程：轻量级的线程，又称之为纤程，是一种用户态的轻量级线程，实际上只有一个单线程完成。

操作系统将CPU时间片分配给多个线程，每个线程在指定放到时间片内完成。操作系统不断从一个线程切换到另一个线程执行，宏观上看就好像是多个线程一起执行。

Python中由于全局锁 (GIL)的存在导致，同一时间只有一个获得GIL的线程在跑，其他线程则处于等待状态，这导致了多线程只是在做分时切换，并不能利用多核。

多线程与多进程的区别：（1）多进程中同一个变量各自有一份拷贝在每个进程中，互不影响；（2）多线程中，所有变量都由所有线程共享，任何一个变量都可被任何一个线程修改。线程之间共享数据的最大危险在于多个线程同时更改一个变量，把内容改乱。

协程优点：创建协程资源消耗非常少，协程的优点是可以用作IO高并发处理

无需上下文切换的开销，没有临界资源的争夺，保证对数据的原子操作，缺点是无法利用多核。

进程拥有自己独立的堆和栈，既不共享堆，也不共享栈，进程由操作系统调度

线程拥有自己独立的栈，和共享的堆，不共享栈，线程也是由操作系统调度

协程和线程一样共享堆，不共享栈，协程由程序员在协程的代码里显示调度

协程避免了无意义的调度，由此可以提高性能，但也因此，程序员必须自己承担调度的责任，同时，协程也失去了标准线程使用多cpu的能力

说协程是进程和线程的升级版,进程和线程都面临着内核态和用户态的切换问题而耗费许多切换时间,而协程就是用户自己控制切换的时机,不再需要陷入系统的内核态.

8、简述COOKIE和SESSION的区别与联系

cookie 和session 的区别：
1、cookie数据存放在客户的浏览器上，session数据放在服务器上。
2、cookie不是很安全，别人可以分析存放在本地的COOKIE并进行COOKIE欺骗,考虑到安全应当使用session。
3、session会在一定时间内保存在服务器上。当访问增多，会比较占用你服务器的性能,考虑到减轻服务器性能方面，应当使用COOKIE。
4、单个cookie保存的数据不能超过4K，很多浏览器都限制一个站点最多保存20个cookie。
cookie 和session 的联系：
session是通过cookie来工作的
session和cookie之间是通过 $_COOKIE['PHPSESSID']来联系的，通过$ _COOKIE[‘PHPSESSID’]可以知道session的id，从而获取到其他的信息

9、简述什么是浏览器的同源策略

所谓同源是指，域名，协议，端口相同。不同源的客户端脚本在没有明确授权的情况下，不能读写对方的资源

10.git commit –amend有何用处

比方说，你的代码已经提交到git库，leader审核的时候发现有个Java文件代码有点问题，于是让你修改，通常有2种方法：方法1：leader 将你提交的所有代码 abandon掉，然后你回去通过git reset …将代码回退到你代码提交之前的版本，然后你修改出问题的Java文件，然后git add xx.java xxx.java -s -m “Porject : 1.修改bug…”
最后通过git push origin HEAD:refs/for/branches方法2：leader不abandon代码，你回去之后，修改出问题的Java文件，修改好之后，git add 该出问题.java
然后git commit –amend –no-edit,
最后git push origin HEAD:refs/for/branches

11.git如何查看某次提交修改的内容

我们首先可以git log显示历史的提交列表：

之后我们用git show 便可以显示某次提交的修改内容

同样 git show filename 可以显示某次提交的某个内容的修改信息

12.git如何比较两个commit的区别

git diff commit-id-1 commit-id-2 > d:/diff.txt

结果文件diff.txt中：

"-"号开头的表示 commit-id-2 相对 commit-id-1 减少了的内容。
"+"号开头的表示 commit-id-2 相对 commit-id-1 增加了的内容。

13.git如何把分支A上某个commit应用到分支B上

\1. 执行git log -3 --graph A，查看A分支下的commit: 注：commit 后面的hash值代表某个commit，这里把”82f1fb7138c5860cc775b4b5ea71c5d19c4e6497“这个commit提交到B。

\2. 执行git checkout B，切换到B分支;

\3. 执行git cherry-pick 82f1fb7138c5860cc775b4b5ea71c5d19c4e6497，该commit便被提交到了B分支;

\4. git push //注：将该commit推到远程服务器

14.如何查看linux系统的启动时间，磁盘使用量，内存使用量

top

HTTP****协议

1、请列举常见的HTTP头及其作用

Accept:指浏览器或其他客户可以接爱的MIME文件格式。可以根据它判断并返回适当的文件格式。

Accept-Charset：指出浏览器可以接受的字符编码。英文浏览器的默认值是ISO-8859-1.

Accept-Language：指出浏览器可以接受的语言种类，如en或en-us，指英语。

Accept-Encoding：指出浏览器可以接受的编码方式。编码方式不同于文件格式，它是为了压缩文件并加速文件传递速度。浏览器在接收到Web响应之后先解码，然后再检查文件格式。

Cache-Control：设置关于请求被代理服务器存储的相关选项。一般用不到。

Connection：用来告诉服务器是否可以维持固定的HTTP连接。HTTP/1.1使用Keep-Alive为默认值，这样，当浏览器需要多个文件时(比如一个HTML文件和相关的图形文件)，不需要每次都建立连接。

Content-Type：用来表名request的内容类型。可以用HttpServletRequest的getContentType()方法取得。

Cookie：浏览器用这个属性向服务器发送Cookie。Cookie是在浏览器中寄存的小型数据体，它可以记载和服务器相关的用户信息，也可以用来实现会话功能。

2、请列举常见的HTTP状态码响应码及其意义

状态代码有三位数字组成，第一个数字定义了响应的类别，且有五种可能取值：

1xx：指示信息–表示请求已接收，继续处理

2xx：成功–表示请求已被成功接收、理解、接受

3xx：重定向–要完成请求必须进行更进一步的操作

4xx：客户端错误–请求有语法错误或请求无法实现

5xx：服务器端错误–服务器未能实现合法的请求

常见状态代码、状态描述、说明：

200 OK //客户端请求成功

400 Bad Request //客户端请求有语法错误，不能被服务器所理解

401 Unauthorized //请求未经授权，这个状态代码必须和WWW-Authenticate报头域一起使用

403 Forbidden //服务器收到请求，但是拒绝提供服务

404 Not Found //请求资源不存在，eg：输入了错误的URL

500 Internal Server Error //服务器发生不可预期的错误

503 Server Unavailable //服务器当前不能处理客户端的请求，一段时间后可能恢复正常

3、请简述对REST API设计规范的理解

REST API是使用统一资源标识符（url）来搜寻资源有七大设计原则：

\1. url结尾不应包含（/）

\2. 正斜杠分隔符（/）必须用来指示层级关系

\3. 应使用连字符（-）来提高url的可读性

\4. 不得在url中使用下划线（_）

\5. url路径中首选小写字母

\6. 文件扩展名中不应包含在url中

\7. 端点名称是单数（但是实际上为了保持url格式的一致性建议使用复数形式）

正在构建的服务中的每个资源将至少有一个url标识它，这个url最好是有意义的，且能充分藐视资源。url应遵循可预测的层次结构，用来提高其可理解性，可用性：可预测的意义在于他们是一致的，他的层次结构在数据关系上时有意义的。

REST API是使用者编写的，url的名称和结构应该能够向使用者传达更清晰的含义。通过遵循上述规则，您将创建一个更清晰的REST API与更友好的客户端。

4、请简述HTTP缓存机制

简单来说就是把一个已经请求过的 Web 资源（如 html 页面，图片，js，数据等）拷贝一份副本储存在浏览器中。缓存会根据进来的请求保存输出内容的副本。当下一个请求来到的时候，如果是相同的 URL，缓存会根据缓存机制决定是直接使用副本响应访问请求，还是向源服务器再次发送请求。比较常见的就是浏览器会缓存访问过网站的网页，当再次访问这个 URL 地址的时候，如果网页没有更新，就不会再次下载网页，而是直接使用本地缓存的网页。只有当网站明确标识资源已经更新，浏览器才会再次下载网页

好处：

减少请求次数，减小服务器压力,本地数据读取速度更快，让页面不会空白几百毫秒,在无网络的情况下提供数据。

其他

1、请列举经常访问的技术网站或博客

知乎 http://www.zhihu.com/
博客园 http://www.cnblogs.com/
开源中国社区 http://www.oschina.net/
红黑联盟 http://www.2cto.com/

2、请列举最近关注的一些技术

3、请列举你认为不懂得一些技术书籍和你最近在看的书籍（不限于技术）

4、请列举你阅读过源码的一些项目

5、请给出你对这份笔试题的看法

一、Python****题

1.请列举你所知道的Python代码检测工具及它们之间的区别

Flake8 是由Python官方发布的一款辅助检测Python代码是否规范的工具，相对于目前热度比较高的Pylint来说，Flake8检查规则灵活，支持集成额外插件，扩展性强。Flake8是对下面三个工具的封装：

1）PyFlakes：静态检查Python代码逻辑错误的工具。

2）Pep8：静态检查PEP8编码风格的工具。

3）NedBatchelder’s McCabe script：静态分析Python代码复杂度的工具。

不光对以上三个工具的封装，Flake8还提供了扩展的开发接口

Pylint是一个 Python 代码分析工具，它依据的标准是Guido van Rossum的PEP8。它分析 Python 代码中的错误，查找不符合代码风格标准和有潜在问题的代码。目前Pylint的最新版本是 pylint-0.18.1。

Pylint是一个 Python 工具，除了平常代码分析工具的作用之外，它提供了更多的功能：如检查一行代码的长度，变量名是否符合命名标准，一个声明过的接口是否被真正实现等等。

Pylint的一个很大的好处是它的高可配置性，高可定制性，并且可以很容易写小插件来添加功能。

如果运行两次Pylint，它会同时显示出当前和上次的运行结果，从而可以看出代码质量是否得到了改进。

2.请简述你对单元测试的理解并列举Python单元测试相关的工具和库

在编写代码的时候，所有的错误都可以通过对代码的仔细测试检查出来，Unittesting特指在一个分隔的代码单元中的测试。一个单元可以是整个模块，一个单独的类或者函数，或者这两者间的任何代码。然而，重要的是，测试代码要与我们没有测试到的其他代码相互隔离，因为其他代码本身有错误的话会因此混淆测试结果，因此便有了单元测试的概念，单元测试的重要性就不多说了，python中有太多的单元测试框架和工具，什么unittest, testtools, subunit, coverage, testrepository, nose, mox, mock, fixtures, discover，再加上setuptools, distutils等等这些，先不说如何写单元测试，光是怎么运行单元测试就有N多种方法，再因为它是测试而非功能，是很多人没兴趣触及的东西。但是作为一个优秀的程序员，不仅要写好功能代码，写好测试代码一样的彰显你的实力。

3.请给出下面代码片段的输出并阐述涉及的Python相关机制

def dict_updater(k,v,dic={}):

dic{k} = v

print(dic)

dict_updater(“one”,1)

dict_updater(“two”,2)

dict_updater(“three”,3,{})

**5.**以下操作的时间复杂度是多少？

list.index

dict.get

x in set(…)

**6.**解释以下输出的原因

>>> ‘（:0.2f）’.format(0.135)

‘0.14’

>>> ‘(:0.2f)’.format(0.145)

‘0.14’

**7.**简述代码抛出以下异常的原因

IndexError：超出对象索引的范围时抛出的异常

AttributeError：当访问的对象属性不存在的时候抛出的异常

AssertionError：当assert断言条件为假的时候抛出的异常

NotImplementedError：尚未实现的方法

StopIteration：迭代器没有更多的值

TypeError：类型错误，通常是不通类型之间的操作会出现此异常

**10.**参考下面代码片段

1|class Context：

2| #TODO

3| pass

5|with Context() as ctx:

6| ctx.do_something()

请在context类下添加代码完成该类的实现.

二、 MySQL

1.请列举常见的MySQL存储引擎

MyISAM存储引擎、InnoDB存储引擎、MEMORY存储引擎、MERGE存储引擎。

2.InnoDB****有哪些特性

特性：插入缓存（insert buffer）、两次写(double write)、自适应哈希(Adaptive Hash index)、异步IO(Async IO)、刷新邻接页(Flush Neighbor Page)等。

3.请列出一些MySQL数据库查询优化的技巧

①、对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引；

②、应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描；

③、应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描；

④、应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描；

⑤、in 和 not in 也要慎用，否则会导致全表扫描；

⑥、在新建临时表时，如果一次性插入数据量很大，那么可以使用 select into 代替 create table，避免造成大量 log ，以提高速度；如果数据量不大，为了缓和系统表的资源，应先create table，然后insert。等等。

1**．如何快速计算两个list****的交集、并集**

简单的方法：

1 a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

2 b = [2, 5, 8, 11, 0]

3 # 交集（intersection）

4 intersection = [v for v in a if v in b]

5 # 并集（ union）

6 union = b.extend([v for v in a])

高效的方法：

1 # 交集（intersection）

2 intersection = list(set(a).intersection(set(b)))

3 # 并集（union）

4 union = list(set(a).union(set(b)))

**2.**翻转一个字符串s = "abcdef"

3.谈一谈你对list、tuple**、set****、dict****的理解和区别**

4.举出几个Python自省的例子

python自省是python具有的一种能力，使程序员面向对象的语言所写的程序在运行时,能够获得对象的类python型。Python是一种解释型语言。为程序员提供了极大的灵活性和控制力。

Python中常用的自省函数

1、help() 用来查看很多Python自带的帮助文档信息。

2、dir() 可以列出对象的所有属性。

3、type()返回对象的类型。

4、id()返回对象的“唯一序号”。对于引用对象来说,返回的是被引用对象的id()。

5、hasattr()和getattr()分别判断对象是否有某个属性及获得某个属性值。

6、callable()判断对象是否可以被调用。

7、isinstance()可以确认某个变量是否有某种类型。

**5.**说说你对迭代器和生成器的理解

迭代器是一个带状态的对象，它能在你调用next()方法的时候返回容器中的下一个值，任何实现了inter和next()（Python2中实现next()）方法的对象都是迭代器，iter返回迭代器自身，next返回容器的下一个值，如果容器中没有更多的元素了，则抛出Stopiteration异常，至于它们到底是如何实现的并不重要。正是因为他是通过next()来返回迭代器中的元素，所以它是一种延迟计算方式返回对象，这种特点对于大数据量元素进行遍历时具有明显优势，他不会一次性把所有元素载入内存，而是遍历一个载入一个，大大降低了内存的占用。

生成器，简单来说就是使用了yield关键字的函数，都叫做生成器。例如：

yield的作用是发起当前执行的函数，并返回，直到调用next()，继续执行后续指令，直到再次遇到yield或者抛出StopIteration异常。上面的例子第一次运行生成器f，需要首先调用f.next()启动生成器。

生成器的优点：代码实现更加简洁，可以提高代码的可读性。同时当然也具有迭代器的优点，大量数据遍历时内存占用少。

需要注意的是：生成器一定是迭代器，但是迭代器不一定是生成器，因为创建一个迭代器只需要实现iter和next()方法就可以了，并不一定要使用yield实现。生成器的唯一注意事项就是：生成器只能遍历一次。

**6.**实现一个二分查找

二分查找：在一段数字内，找到中间值，判断要找的值和中间值大小的比较。

如果中间值大一些，则在中间值的左侧区域继续按照上述方式查找。

如果中间值小一些，则在中间值的右侧区域继续按照上述方式查找。

直到找到我们希望的数字。

Python实现二分查找算法，代码如下：

7.实现一个装饰器，用于鉴权（已经有鉴权函数user_auth(user_id,token)）

补充注释：内存中存在的pool也只有一个

9.用一条命令关掉所有的Python进程

quit() exit() 执行到此命令时，程序终止。

如果是程序陷入死循环，想强制结束，则按Ctrl + C

10.在用git提交中，如何避免提交pyc****文件

一般来说每个Git项目中都需要一个“.gitignore”文件，这个文件的作用就是告诉Git哪些文件不需要添加到版本管理中。实际项目中，很多文件都是不需要版本管理的，比如Python的.pyc文件和一些包含密码的配置文件等等。这个文件的内容是一些规则，Git会根据这些规则来判断是否将文件添加到版本控制中。

有两种方法可以实现过滤掉Git里不想上传的文件：

针对单一工程排除文件，这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一份规则，而不是张三自己有一套过滤规则，李四又使用另一套过滤规则，个人比较喜欢这个。配置步骤如下：

在工程根目录下建立.gitignore文件，将要排除的文件或目录写到.gitignore这个文件中，其中有两种写入方法。

a) 使用命令行增加排除文件

排除以.class结尾的文件 echo “*.class” >.gitignore (>>是在文件尾增加,>是删除已经存在的内容再增加)，之后会在当前目录下生成一个.gitignore的文件。

排除bin目录下的文件 echo “bin/” >.gitignore

b)最方便的办法是，用记事本打开，增加需要排除的文件或目录，一行增加一个，例如：

2）第二种方法

全局设置排除文件，这会在全局起作用，只要是Git管理的工程，在提交时都会自动排除不在控制范围内的文件或目录。这种方法对开发者来说，比较省事，只要一次全局配置，不用每次建立工程都要配置一遍过滤规则。但是这不保证其他的开发者在克隆你的代码后，他们那边的规则跟你的是一样的，这就带来了代码提交过程中的各种冲突问题。

配置步骤如下：

a）像方法（1）一样，也需要建立一个.gitignore文件，把要排除的文件写进去。

b）但在这里，我们不规定一定要把.gitnore文件放到某个工程下面，而是任何地方，比如我们这里放到了Git默认的Home路径下，比如：/home/wangshibo/hqsb_ios

c）使用命令方式可以配置全局排除文件gitconfig --global core.excludesfile _{/.gitignore，你会发现在}/.gitconfig文件中会出现excludesfile = /home/wangshibo/hqsb_ios/.gitignore。

说明Git把文件过滤规则应用到了Global的规则中。

**1.**你对新的工作是怎么考虑的，就是为什么来北京了呢

**2.**找工作侧重于哪方面，什么行业或者说公司主营的方向自研软件还是外包

3.一个TXT****文件，不打开，想往里面插入一条命令

**4.**用户注册用户名时，如何做一些控制（如何防止注入攻击）

程序开发过程中不注意规范书写sql语句和对特殊字符进行过滤，导致客户端可以通过全局变量POST和GET提交一些sql语句正常执行。产生Sql注入。下面是防止办法：

a. 过滤掉一些常见的数据库操作关键字，或者通过系统函数来进行过滤。

b. 在PHP配置文件中将Register_globals=off;设置为关闭状态

c. SQL语句书写的时候尽量不要省略小引号(tab键上面那个)和单引号

d. 提高数据库命名技巧，对于一些重要的字段根据程序的特点命名，取不易被猜到的

e. 对于常用的方法加以封装，避免直接暴漏SQL语句

f. 开启PHP安全模式：Safe_mode=on;

g. 打开magic_quotes_gpc来防止SQL注入

h. 控制错误信息：关闭错误提示信息，将错误信息写到系统日志。

i. 使用mysqli或pdo预处理。

**5.**你做的是前端还是后端，前后端之间的接口是怎么规定的，比如前端是用什么写的，后端是用什么写的，

**6.**项目有几个人，前端几个，后端几个

7.怎么从request****判断是哪个用户发来的

会话（Session）跟踪是Web程序中常用的技术，用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份，Session通过在服务器端记录信息确定用户身份。

8.request****有几种类型的请求

请求类型：

>>>r = request.post(‘https://httpbin.org/post’)

>>>r = request.put(‘http://httpbin.org/put’)

>>>r = request.delete(‘http://httpbin.org/delete’)

>>>r = request.head(‘http://httbin.org/head’)

>>>r = request.options(‘http://httpbin.org/options’)

9.post****请求发送成功返回的状态码

2XX是请求正常处理完毕的意思，表示成功状态码

分为三类：

200 ok表示从客户端发来的请求在服务器被正常处理了。

204 no content 表示从客户端发来的请求在服务器被正常处理了，但在返回的响应报文中不含实体的主体部分。

206 partial content 表示客户端进行了范围请求，而服务器成功执行了这部分的GET请求。

10.mysql****设计了几张表

11.pycharm****装在哪里（服务器还是个人主机）

12.如何把项目导入pycharm****里

13.django服务起来的时候，有那几个框架，比如wsgi**，ngix一起启动，ngix和wsgi之间还有什么**

14.Linux熟悉到什么程度，知道很多servers****都放在哪里吗

15.vi****用的多吗

比较常用，编辑代码的工具一般就是vi和sublime。

16.Linux****装在哪里，个人电脑上吗？

linux版本很多，看自己的需求，常见的有suse，fedora，centos，ubantu，红帽等。个人使用，建议使用suse，fedora，图形界面的建议使用ubantu

可以装在个人电脑上，linux跟Windows一样都是操作系统，只不过在操作系统之上应用软件多少罢了，而且不像以前linux只能安装在特殊架构的机器上，并不是咱们用的这种X86平台上的。你可以在windows上装个虚拟机软件

面试问题

1**、Linux和windows的区别**

价格和开源

在中国，windows和linux都是免费的，至少对个人用户是如此，但是Windows盗版比较严重，如果严打，对Linux来说就是一大好处。

开源就是指对外部开放软件源代码。

windows平台:数量和质量的优势，不过大部分为收费软件；由微软官方提供重要支持和服务。

linux平台：大都为开源自由软件，用户可以修改定制和再发布，由于基本免费没有资金支持，部分软件质量和体验欠缺。

2**、用户用登陆注册页面时报错400****，403****，500****怎样排查出来错误**

400错误：由于语法格式有误，服务器无法理解此请求。不作修改，客户程序就无法重复此请求。

403错误：

403.1 禁止：禁止执行访问

如果从并不允许执行程序的目录中执行 CGI、ISAPI或其他执行程序就可能引起此错误。

如果问题依然存在，请与 Web 服务器的管理员联系。

403.2 禁止：禁止读取访问

如果没有可用的默认网页或未启用此目录的目录浏览，或者试图显示驻留在只标记为执行

脚本权限的目录中的HTML 页时就会导致此错误。

如果问题依然存在，请与 Web 服务器的管理员联系。

403.3 禁止：禁止写访问

如果试图上载或修改不允许写访问的目录中的文件，就会导致此问题。

如果问题依然存在，请与 Web服务器的管理员联系。

403.4 禁止：需要 SSL

此错误表明试图访问的网页受安全套接字层（SSL）的保护。要查看，必须在试图访问的地址前输入https:// 以启用 SSL。

如果问题依然存在，请与 Web服务器的管理员联系。

403.5 禁止：需要 SSL 128

此错误消息表明您试图访问的资源受 128位的安全套接字层（SSL）保护。要查看此资源

需要有支持此SSL 层的浏览器。

请确认浏览器是否支持 128 位 SSL安全性。如果支持，就与 Web服务器的管理员联系，并报告问题。

403.6 禁止：拒绝 IP 地址

如果服务器含有不允许访问此站点的 IP地址列表，并且您正使用的 IP地址在此列表中，

会导致此问题。

如果问题依然存在，请与 Web服务器的管理员联系。

403.7 禁止：需要用户证书

当试图访问的资源要求浏览器具有服务器可识别的用户安全套接字层（SSL）证书时就会

致此问题。可用来验证您是否为此资源的合法用户。

请与 Web服务器的管理员联系以获取有效的用户证书。

403.8 禁止：禁止站点访问

如果 Web服务器不为请求提供服务，或您没有连接到此站点的权限时，就会导致此问题。

请与 Web 服务器的管理员联系。

403.9 禁止访问：所连接的用户太多

如果 Web太忙并且由于流量过大而无法处理您的请求时就会导致此问题。请稍后再次连接。

如果问题依然存在，请与 Web 服务器的管理员联系。

403.10 禁止访问：配置无效

此时 Web 服务器的配置存在问题。

如果问题依然存在，请与 Web服务器的管理员联系。

403.11 禁止访问：密码已更改

在身份验证的过程中如果用户输入错误的密码，就会导致此错误。请刷新网页并重试。

如果问题依然存在，请与 Web服务器的管理员联系。

403.12 禁止访问：映射程序拒绝访问

拒绝用户证书试图访问此 Web 站点。

请与站点管理员联系以建立用户证书权限。如果必要，也可以更改用户证书并重试。

500错误：

500 服务器的内部错误

Web 服务器不能执行此请求。请稍后重试此请求。

如果问题依然存在，请与 Web服务器的管理员联系。

3**、算法（二叉树）等**

二叉树是有限个元素的集合，该集合或者为空，或者有一个称为根节点的元素及两个互不相交的、分别被称为左子树和右子树的二叉树组成。

1> 二叉树的每个结点至多只有二棵子树(不存在度大于2的结点)，二叉树的子树有左右之分，次序不能颠倒。

2> 二叉树的第i层至多有2^{i-1}个结点

3> 深度为k的二叉树至多有2^k-1个结点；

4> 对任何一棵二叉树T，如果其终端结点数为N0，度为2的结点数为N2，则N0=N2+1

4**、nginx****部署具体操作**

Nginx的特点：静态资源的高并发，反向代理加速，支持FastCGI，运行SSL、TSL

环境部署：

1：安装编译环境

yum install -y gcc gcc-c++ opensslopenssl-devlepcrepcre-devel make get curl

pcre-devel兼容正则表达式

2:创建安装目录，下载资源

mkdir -p /Application/tools

wgethttp://nginx.org/download/nginx-****.tar.gz

3 解压文件，并进入安装文件目录

tar zxf nginx-.tar.gz && cd nginx-

4:创建用户

创建一个没有家目录的且不能登录的用户nginx

sudo useraddnginx -s /sbin/nologin -M

sudo id nginx

uid=501(nginx) gid=501(nginx) groups=501(nginx)

5配置

./configure --user=nginx --group=nginx --prefix=/Application/nginx-** --with-http_sub_module

指定运行软件的用户名运行软件的组指定安装路径启用Nginx运行状态模块

6编译并安装

make && make install

7测试安装结果

7.1：查看进程

ps -ef |grep nginx |grep -v grep

root 2232 1 0 11:14 ? 00:00:00 nginx: master process /usr/local/nginx/sbin/nginx

nginx 9451 2232 0 13:58 ? 00:00:00 nginx: worker process

7.2：查看端口

netstat -antulp |grep nginx

tcp 0 0 0.0.0.0:80 0.0.0.0: LISTEN 2232/nginx

7.3：文本工具测试

7.3.1：curl 127.0.0.1

Welcome access www.52linux.club

7.3.2：www.52linux.club

8:创建软链接

1.用于版本升级中，代码的固定安装位置或参数的引用

2.ln -s /Application/nginx-1.12.1 /usr/loacl/nginx

lrwxrwxrwx 1 root root 25 Mar 16 15:49 nginx -> /Application/nginx-1.12.1

5**、正则表达式的符号代表的意思**

6**、uwsgi****用的哪个版本**

2.0.9

Python面试题目

\1. 单引号，双引号，三引号的区别

单引号里可以包含双引号和转义字符，但不能包含单引号。

双引号里可以包含单引号和转义字符，但不能包含双引号。

三引号里可以包含单引号和双引号，另外还有换行，注释功能。

\2. Python的参数传递是值传递还是引用传递？

python中的一切事物皆为对象，并且规定参数的传递都是对象的引用

\3. 什么是lambda函数？它有什么好处?

概念：lambda函数是一个可以接收任意多个参数(包括可选参数)并且返回单个表达式值的函数。

好处：

使用Python写一些执行脚本时，使用lambda可以省去定义函数的过程，让代码更

加精简。

对于一些抽象的，不会别的地方再复用的函数，有时候给函数起个名字也是个难题，

使用lambda不需要考虑命名的问题。

使用lambda在某些时候让代码更容易理解。

\4. Python是如何进行内存管理的?

python内部使用引用计数，来保持追踪内存中的对象，Python内部记录了对象有多少个引用，即引用计数，当对象被创建时就创建了一个引用计数，当对象不再需要时，

这个对象的引用计数为0时，它被垃圾回收。

\5. 说出下面list1,list2,list3的输出值

defextendList(val, list=[]):

list.append(val)

returnlist

list1 =extendList(10)

list2 =extendList(11,[])

list3 =extendList(‘b’)

print(“list1 = %s”%list1)

print"list2 = %s"%list2)

print"list3 = %s"%list3)

list1 = [10, ‘b’]

list2 = [11]

list3 = [10, ‘b’]

\6. 用你认为最Pythonic的代码实现对下面文档的websocket接口数据（Partial Book Depth Streams）的采集，支持symbol、levels可动态配置；接口地址：https://github.com/binance-exchange/binance-official-api-docs/blob/master/web-socket-streams.md

１．python常用的数据结构的类型及特性

答：数字型（整数型(int)，浮点数型，复数型，布尔数型）：

特性：１、只能存放一个值　２、一经定义，不可更改　３、直接访问

字符串型：

特性：1、用来存储文本信息的容器 2、不可变数据类型　 3、序列

列表:

特性：１、可存放多个值２、可变数据类型３、序列４、表内元素直接无联系

元祖：

特性：１、可存放多个值２、不可变数据类型３、序列４、表内元素直接无联系

字典：

特性：１、可存放多个值２、以键值对方式存储３、无序４、可变数据类型 5、键是唯一的

集合：

特性：１、可存放多个值　２、元素唯一　３、无序　４、可变数据类型　５、可用作字典的键

字节型：存储以字节为单位的数据

特性：１、只能存放一个值　２、不可变数据类型　３、有序

２．已知Alist = [1,2,3,1,2],对Alist 列表元素去重，写出具体过程

答：Alist= list(set(Alist))

3.选出一下表达式表述正确的选项：

Ａ：{1:0,2:0,3:0}

B : {‘a’ :0,’b’:0,’c’:0}

C : {{1,2}:0,｛2,3｝：0｝

Ｄ：{[1,3]:0,[2,3]:0}

E :{(1,3):0,(2,5)😃}

答：ＡＢＥ

4.已知

Alist = [1,2,3]

Bset = {1,2,3}

(1)从Alist和Bset 中查找４，最坏时间复杂度哪个大？

(２)从Alist和Bset 中插入４，最坏时间复杂度哪个大？

最坏时间复杂度：

答：１）

５．写出一下问题的具体方法和过程：

A = [1,2,3]

B = {1,2,4}

(1)求Ａ和Ｂ的交集？

(2)求Ａ和Ｂ的并集？

(3)求Ａ和Ｂ的差集？

答：１) Ａ&B : {1,2}

A | B : {1,2,3,4}
A – B: {3} , B – A : {4}

已知ip = ‘192.168.0.100’

提取ip的各部分并写入列表的显示过程

答：ip.split(“.”)

7.简述一下协议HTTP，tcp,udp

答：

http:规定了浏览器与服务器之间的请求和响应的格式与规则，它是万维网上能够可靠地交换文件的重要基础。

tcp：传输可靠性，无错序，无漏，无缺失，传输过程中有建立和断开连接过程即三次握手四次挥手的过程，适用情况：稳定传输文件，网络良好的情况。邮件等大型数据

udp：不能保证数据传输的可靠性，没有建立和断开连接的过程，信息收发比较自由。

适用情况：网络视频，群聊，发广播。

1 单元测试，单例模式，

单元测试（unit testing），是指对软件中的最小可测试单元进行检查和验证。对于单元

测试中单元的含义，一般来说，要根据实际情况去判定其具体含义，如C语言中单元

指一个函数，Java里单元指一个类，图形化的软件中可以指一个窗口或一个菜单等。

总的来说，单元就是人为规定的最小的被测功能模块。单元测试是在软件开发过程中

要进行的最低级别的测试活动，软件的独立单元将在与程序的其他部分相隔离的情况

下进行测试。

单例模式，是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例的

特殊类。通过单例模式可以保证系统中，应用该模式的类一个类只有一个实例。即一

个类只有一个对象实例.

2 类方法，静态方法区别，

静态方法是类中的函数，不需要实例。静态方法主要是用来存放逻辑性的代码，主要是

一些逻辑属于类，但是和类本身没有交互，即在静态方法中，不会涉及到类中的方法和

属性的操作。可以理解为将静态方法存在此类的名称空间中

类方法是将类本身作为对象进行操作的方法。他和静态方法的区别在于：不管这个方式

是从实例调用还是从类调用，它都用第一个参数把类传递过来。

3 Python中的复制，底层是怎么实现的.

Python中，对象的赋值实际上是简单的对象引用。也就是说，当你创建一个对象，然

后把它复制给另一个变量的时候，Python并没有拷贝这个对象，而是拷贝了这个对象

的引用。

4 登录一个网站发生的过程，越详细越好，

一个网页从请求到最终显示的完整过程一般可分为如下7个步骤：

\1. 在浏览器中输入网址；

\2. 发送至DNS服务器并获得域名对应的WEB服务器的IP地址；

\3. 与WEB服务器建立TCP连接；

\4. 浏览器向WEB服务器的IP地址发送相应的HTTP请求；

\5. WEB服务器响应请求并返回指定URL的数据，或错误信息，如果设定重定向，则重定向到新的URL地址。

\6. 浏览器下载数据后解析HTML源文件，解析的过程中实现对页面的排版，解析完成后在浏览器中显示基础页面。

\7. 分析页面中的超链接并显示在当前页面，重复以上过程直至无超链接需要发送，完成全部显示。

5 说一下HTTP协议，

超文本传输协议是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须

遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。

HTTP是一个客户端和服务器端请求和应答的标准。客户端是终端用户，服务器端是网

站。通过使用Web浏览器、网络爬虫或者其它的工具，客户端发起一个到服务器上指

定端口的HTTP请求，叫用户代理。应答的服务器上存储着资源，比如HTML文件和图

像。这个应答服务器为源服务器。在用户代理和源服务器中间可能存在http和其他几

种网络协议多个中间层，比如代理，网关，或者隧道（tunnels）。尽管TCP/IP协议是互

联网上最流行的应用，HTTP协议并没有规定必须使用它和它支持的层。事实上，HTTP

可以在任何其他互联网协议上，或者在其他网络上实现。HTTP只假定可靠的传输，任

何能够提供这种保证的协议都可以被其使用。

6 MySQL如何优化

\1. 选择合适的存储引擎: InnoDB

\2. 保证从内存中读取数据，将数据保存在内存中

\3. 定期优化重建数据库

\4. 降低磁盘写入操作

\5. 提高磁盘读写速度

\6. 充分使用索引

\7. 分析查询日志和慢查询日志

\8. 激进的方法。使用内存磁盘

\9. 用 NOSQL 的方式使用 MYSQL

1．垃圾回收机制有那些？

答：引用计数、标记-清除、标记-缩并、节点拷贝、分代回收

2.迭代器和生成器是怎么实现的？

3.创建一个树型结构中的节点对象TreeNode(JavaBean),适用至少包含三个属性：

１节点的ＩＤ

１父节点的ＩＤ

１节点的名字

加上已由若干个该节点的实例组成了一个树型结构，并且已存在函数：

public TreeNode[] getAllNodes()

该函数可以返回树型结构中所有节点的实例

要求实现一个函数public void showHierachicalName(int id)

使得该函数实现将（节点ＩＤ==id)的节点名称及其所有子节点的节点名全部显示出来

显示名称使用　System.out.println(String v)函数。

答：

treeNodes = []

class TreeNode:

def init(self, pid = None, nid = 0, name = 0):

self.pid = pid

self.nid = nid

self.name = name

treeNodes.append(self)

def getAllNodes():

return treeNodes

def showHierachicalNames(cid):

for i in getAllNodes():

if i.pid == cid:

print(i.name, end = ’ ')

showHierachicalNames(i.nid)

1、简述HTTP

答：tcp应用值HTTP传输

http协议 —> 超文本传输协议应用层协议

用途：网页的获取，基于网站的数据传输

基于http协议的数据传输

特点：

1.一个应用层协议，传输层使用tcp传输

2.简单灵活，和多种语言对接方便

3.无状态协议，不记录用户的通信内容

4.成熟稳定http1.1

工作模式：

1.使用http双方均遵循http协议规定发送接收消息体。

2.请求方，根据协议住址请求内容发送给对象

3.服务方，收到内容按照协议解析

4.服务方，将回复内容按照协议组织发送给请求方

5.请求方，收到回复根据协议解析

2.Selenium

答：Selenium [1] 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。这个工具的主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。

3、简述一下sql去重

答：

数据库中的去重操作（删除数据库中重复记录的SQL语句）主要有二种方法

（1）、group by 方法

主要用于分组统计,一般都是使用在聚合函数中使用；

（2）、distinct方法

一般用于比较小的表进行去重,会过滤掉多余的重复记录，返回不重复的记录或字段；

4.简述判断链表是否为循环链表

答：

为了验证链表是不是循环链表，首先要创建循环链表，其次是打印循环链表，验证循环链表是不是创建成功，最后写函数判断是不是循环链表。

创建循环链表代码如下所示：

/**

* @author jcm

* @see 创建循环链表

* @param list

public void createCircularLinkList(Node head) {

//构建循环链表

Node current = head;

while(current.next != null){

current = current.next;

}

current.next = head;

}

打印循环链表代码如下所示：

/**

* @author jcm

* @see 打印循环链表

* @param head

public void printCircularLinkList(Node head){

Node current = head;

while(current.next != head){//判断最后一个结点是不是指向头结点

System.out.print(current.data+" ");

current = current.next;

}

System.out.print(current.data+" ");

}

判断是不是循环链表代码如下所示：

/**

* @author jcm

* @see 判断是不是循环链表

* @param head

* @return

public booleanisCircularLinkList(Node head){

if(head == null || head.next == null){

return false;

}

Node firstNode = head;

Node secondNode = head;

while(firstNode != null){//first走的快，如果条件不成立，说明可定不是循环链表

if(firstNode != null){

firstNode = firstNode.next;//每次循环要走两步

secondNode = secondNode.next;

}

if(firstNode != null){

firstNode = firstNode.next;

}

if(firstNode == secondNode){//判断是不是相等

return true;

}

return false;

}

5、简述爬虫如何处理附件问题

答：

6.简述内键函数Map resure filter 区别

答：

map() 会根据提供的函数对指定序列做映射。

第一个参数 function 以参数序列中的每一个元素调用 function 函数，返回包含每次 function 函数返回值的新列表。

filter() 函数用于过滤序列，过滤掉不符合条件的元素，返回由符合条件元素组成的新列表。该接收两个参数，第一个为函数，第二个为序列，序列的每个元素作为参数传递给函数进行判，然后返回 True 或 False，最后将返回 True 的元素放到新列表中。

reduce（）函数

reduce 函数可以按照给定的方法把输入参数中上序列缩减为单个的值，具体的做法如下：首先从序列中去除头两个元素并把它传递到那个二元函数中去，求出一个值，再把这个加到序列中循环求下一个值，直到最后一个值。

中科软2018年春季运维工程师试题

一、单选

1.下面哪个语句在python中是非法的 B

A.x = y = z = 1 B.x = (y = z + 1)

C.x, y = y, x D.x += y

2.关于python内存管理，下列说法错误的是 B

A.变量不必先声明 B.变量无需先创建和赋值而直接使用

C.变量无需指定类型 D.可以使用del释放资源

3.下边哪个不是python合法的标识符 B

A.int32 B.40XL C.self D.name

4.下列哪种说法是错误的 D

A.除字典类型外，所有标准对象均可用于布尔测试

B.空字符串的布尔值是False

C.空列表对象的布尔值是False

D.值为0的任何数字对象的布尔值是False

5.下列表达式的值为True的是 A

A.5+4j > 2-3j B.3>2>2 C.(3,2)<(‘a’,‘b’) D.‘abc’>‘xyz’

6.python不支持的数据类型有 A

A.char B.int C.floatD.list

7.关于Python中的复数，下列说法错误的是 C

A.表示复数的语法是real + imagej B.实部和虚部都是浮点数

C.虚部必须后缀j，且必须小写 D.方法conjugate返回复数的共轭复数

8.关于字符串下列说法错误的是 B

A.字符应该视为长度为1的字符串

B.字符串以\0标志字符串的结束

C.既可用单引号，也可用双引号创建字符串

D.在三引号字符串中可以包含换行回车等特殊字符

9.以下不能创建一个字典的语句是 C

A.dict1 = {} B.dict2 ={3:5} C.dict3 = {[1,2,3]:‘user’} D.dict4 = {(1,2,3):‘user’}

10.下列python语句正确的是 D

A.min = x if x < y = y B.max = x >y ?x : y

C.if(x>y) print x D.while True: pass

11.在/etc/fstab文件中指定的文件系统加载参数中，以下参数一般用于CD-ROM等移动设备的是 D

A.defaultsB.sw C.rw 和roD.noauto

12.Linux文件权限一共10位长度，分四段，第三段表示的内容是 D

A.文件类型 B.文件所有者的权限 C.文件所有者所在组的权限 D.其他用户的权限

13.在下列名称中，不属于DNS服务器类型的是 C

A. Primary Master Server B.Secondary Master Server C.sambaD.Cache_only Server

14.在使用mkdir命令创建新的目录时，在其父目录不存在时先创建父目录的选项是 D

A.-m B.-d C.-f D.-p

15.已知某用户stud1，其用户目录为/home/stud1,分页显示当前目录下的所有文件的文件或目录、用户组、用户

、文件大小、文件或目录权限、文件创建时间等信息的命令是 D

A.morels -al B.more -al lsC.more<ls -al D.ls -al | more

16.在DNS配置文件中，用于表示某主机别名的是 B

A.NS B.CNAME C.NAME D.CN

17.qmail的正确定义是 B

A.收取邮件的协议 B.邮件服务器的一种 C.发送邮件的协议 D.邮件队列

18.已知某用户stud1，其用户目录为/home/stud1,分页显示当前目录下的所有文件的文件或目录、用户组、用户

、文件大小、文件或目录权限、文件创建时间等信息的命令是 D

A.morels -al B.more -al lsC.more<ls -al D.ls -al | more

19.关于进程调度命令，B是不正确的。at-定期执行程序的调度命令 D

A.当日晚11点执行clear命令，使用at命令：at 23:00 today clear

B.每年1月1日早上6点执行date命令，使用at命令：at 6am Jan 1 date

C.每日晚11点执行date命令，crontab文件中应为：023***date

D.每小时执行一次clear命令，crontab文件中应为：0*/1***date

20.系统中有用户user1和user2，同属于users组，在user1用户目录下有一文件file1，它拥有644的权限，

user2想修改user1用户目录下的file1文件，它拥有的权限是 B

A.744 B.664 C.646 D.746

二、简答题

1.Python中pass语句的作用是什么

pass语句不会执行任何操作，一般作为占位符或者创建占位程序，whileFalse:pass

2.单引号，双引号，三引号的区别

单引号和双引号是等效的，如果要换行，需要符号(),三引号则可以直接换行，并且可以包含注释

如果要表示Let’s go 这个字符串

单引号：s4 = ‘Let\’s go’

双引号：s5 = “Let’s go”

s6 = ‘I realylike“python”!’

这就是单引号和双引号都可以表示字符串的原因了

3.字符串格式化:% 和 format的区别

字符串的format函数非常灵活，很强大,可以接受的参数不限个数，并且位置可以不按顺序，而且有较为强大的格式限定符(比如:填充，对齐,精度等)

4.请简述lambda函数的优点

lambda 表达式，通常是在需要一个函数，但是又不想费神去命名一个函数的场合下使用，也就是指匿名函数

lambda函数：首要用途是指点短小的回调函数

好处：1.没有名字节约命名空间

2.变量创建后就被使用、销毁，不占用内存

5.请简述Django框架的MTV模型

M：Models：一个抽象层，用来构建和操作你的web应用中的数据，模型是你的数据的唯一的、权威的信息源。它包含你所储存数据的必要字段和行为。通常，每个模型对应数据库中唯一的一张表。

T:模板(templates)：模板层提供了设计友好的语法来展示信息给用户。使用模板方法可以动态地生成HTML。模板包含所需HTML 输出的静态部分，以及一些特殊的语法，描述如何将动态内容插入。

V:视图（views）：用于封装负责处理用户请求及返回响应的逻辑。视图可以看作是前端与数据库的中间人，他会将前端想要的数据从数据库中读出来给前端。他也会将用户要想保存的数据写到数据库。

6.主机与主机之间通讯的三要素有什么

（1）.IP地址

（2）.子网掩码

（3）.IP路由

7.Linux下统计根目录下后缀为log的文件数量

find . -name ‘*.log’ | wc -l

8.打印3天前的日期，格式如：2016-05-06

date -d 2016-05-06

9.解释ps aux 中的VSZ，RSS

VSZ 虚拟内存集,进程占用的虚拟内存空间

RSS 物理内存集,进程战用实际物理内存空间.

10.符号链接与硬链接的区别

硬链接

创建一个硬链接，相当于在目录列表中，新建一条记录

比如

inode ——-> filename

47 ——->userlist

47 ——-> userlist_2（硬链接创建的）

所谓硬链接就是第二个文件名映射着同一个inode。因此我们可以说userlist与userlist_2是完全一致的，因为inode一样。

符号连接

因为硬链接不能跨硬盘创建。因此提供了第二种连接：符号连接。

它相当于快捷方式。这意味着什么呢？

\1. 符号连接是一个文件，一个与被它连接的文件不一样的文件。它有自己的inode。

\2. （猜测）符号连接的内容应该是一个路径，该路径指示着它连接的文件。这意味着如果该路径的文件被删除了、改名字了，它即将访问不到。如果该路径下的文件被掉包了，它将访问错误的文件。

总结

硬链接是一种映射，符号连接也是一种映射。但是硬链接更加深层，映射到inode。符号连接只是连接到一个路径而已

三、编程题

1.判断一个字符串是否为回文字符串（将字符串反转之后，得到的字符串同原字符串，称为回文字符串

如：‘abcdedcba’）

s = input("请输入文字: ")

# 反转字符串s

r = s[::-1]

if s == r:

print(s, “是回文”)

else:

print(s, “不是回文”)

2.要求用python语言编程实现解决八皇后问题（在8X8格的国际象棋上摆放八个皇后，使其不能相互攻击，即任意

两个皇后都不能处于同一行、同一列或同一斜线上）。

def conflict(state,nextX):#冲突检测函数

nextY=len(state)

fori in range(nextY):

if abs(state[i]-nextX) in (0,nextY-i):#检测是否在同一直线、斜线

return True

return False

def queens(num=8,state=()): #放置皇后,采用元组state来存储皇后的位置

forpos in range(num):

if not conflict(state,pos):

iflen(state)==num-1:

yield (pos,)

else:

for result in queens(num,state+(pos,)):

yield (pos,)+result

for solution in queens(8):

print (solution)

print(‘总共的方法数为：’,len(list(queens(8))))

\1. 有以下数据传输方式：

1> 从一台计算机的A硬盘复制数据到B硬盘

2> 通过10Gbit/s的局域网访问一台机器的内存

3> 通过10Mbit/s的ADSL下载互联网资源

4> 通过快递邮寄1TB硬盘，24小时内送达

以下按照速率排序正确的是：A.

A. 4<3<2<1 B. 4<2<3<1 C .3<4<1<2 D .1<3<4<2

\2. 十进制数值1.5625的二进制表示是：___D.

A 101.1001 B 0.001 C 101.111 D1.1001

小数点左侧：1 二进制还是1

右侧为.5625

采用乘2取整法

.5625*2 = 1.125…1

.125*2 = 0.25 …0

.25*2 = 0.5…0

.5*2 = 1.0…1

所以答案为1.1001

\3. 在操作系统的下列功能组成部分中，__A______不需要硬件的支持

A．进程调度 B时钟管理 C 地址映射 D中断系统

时钟管理用来产生和管理系统时钟，地址映射用来将程序中的逻辑地址转换成内存中的物理地址，中

断系统用于CPU向操作系统进行通信的手段，它们都需要相应的硬件支持，分别是时钟电路、地址

转换机构和中断机构。而进程调度则是完全由软件实现，不需要硬件的直接支持。

\4. 当进程因时间片用完而让出处理机时，该进程应该转变为___A___状态。

A等待 B就绪 C运行 D完成

不是由于自身或外界原因成为等待状态的进程让出处理器时，它的状态就变成就绪状态。

5 若系统中有5台打印机，有多个进程需要使用两台，规定每一个进程一次仅允许申请一台，则至多允许__C_个进程参与竞争，而且不会发生死锁。

A .2 B.3 C.4 D.5

虽然进程在运行过程中，可能发生死锁，但死锁的发生也必须具备一定的条件，死锁的发生必须具备以下四个必要条件。

1 ）互斥条件：指进程对所分配到的资源进行排它性使用，即在一段时间内某资源只由一个进程占用。如果此时还有其它进程请求资源，则请求者只能等待，直至占有资源的进程用毕释放。

2 ）请求和保持条件：指进程已经保持至少一个资源，但又提出了新的资源请求，而该资源已被其它进程占有，此时请求进程阻塞，但又对自己已获得的其它资源保持不放。

3 ）不剥夺条件：指进程已获得的资源，在未使用完之前，不能被剥夺，只能在使用完时由自己释放。

4 ）环路等待条件：指在发生死锁时，必然存在一个进程——资源的环形链，即进程集合{P0，P1，P2，···，Pn}中的P0正在等待一个P1占用的资源；P1正在等待P2占用的资源，……，Pn正在等待已被P0占用的资源。

因此为了避免发生死锁，则不能生成此资源的环形链，则4个进程是极限了。

6 进程间通信方式中访问速度最快的是___E___.

A 管道 B消息队列 C 文件 D套接字 E 共享内存 F 句柄

常见进程间通信方式的比较：

管道：速度慢，容量有限

消息队列：容量受到系统限制，且要注意第一次读的时候，要考虑上一次没有读完数据的问题。

信号量：不能传递复杂消息，只能用来同步

共享内存区：能够很容易控制容量，速度快，但要保持同步，比如一个进程在写的时候，另一个进程要注意读写的问题，相当于线程中的线程安全，当然，共享内存区同样可以用作线程间通讯，不过没这个必要，线程间本来就已经共享了一块内存的。

7 下列_A___动态集合结构中查找一个元素的期望时间最短。

A哈希表 B 链表 C 红黑树 D 二分查找树

哈希表也就是散列表查找是常数级时间复杂度 O(1)，链表是线性级别 O(n)，红黑树和

二分查找数都是对数及时间复杂度 O(logn)，所以结果为A。

\8. 下列描述中，唯一错误的是____A___.

A 本题有5个选项是正确的 B 选项B正确

C选项D正确 D 选项DEF正确

E选项ABC中有一个错误 F 如果其他选项都正确，那么选项F也正确

9 如果参观者到达博物馆的速率是每分钟20人，平均每个人在馆内停留20分钟，那么该博物馆至少需要容纳___D___人才行。

A 100 B 200 C 300 D 400 E 500 F 600

每位客人停留的平均时间是20分钟，因此在第一个二十分钟内馆里的客人只有进入没有离开，因此

20分钟时管内的客容量达到最大，共20*20=400人

简述TCP中三次握手和四次挥手**?**

三次握手

1.客户端向服务器发起连接请求（问是否可以连接）

2.服务器接收到请求后进行确认（允许连接）返回报文

3.客户端收到许可，建立连接

四次挥手

1.主动方发送报文告知被动方要断开连接

2.被动方返回报文，告知受到请求，准备断开

3.被动方发送报文给主动方告知准备就绪可以断开

4.主动方发送报文确定断开

简述TCP协议和UDP协议的区别**?**

tcp协议

面向连接 ----》可靠的数据传输

可靠传输：无失序无差错无丢失无重复

应用情况：适用于传输内容较大，网络情况好，需要提供准确传输的情况

比如：聊天信息，文件传输，邮件

udp协议

面向无连接的服务 ----》不可靠

发送时由发送端自主进行，不考虑接收端

适用情况：网络较差，对传输准确性要求低，广播组播

比如：视频会议，广播数据

a-zA-Z0-9_- ↩︎

花开如雨

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
1.Python面试题持续更新（重点）

1.Python****是如何进行内存管理的？答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制Python内部使用引用计数，来保持追踪内存中的对象，所有对象都有引用计数。引用计数增加的情况：1，一个对象分配一个新名称2，将其放入一个容器中（如列表、元组或字典）引用计数减少的情况：1，使用del语句对对象别名显示的销毁2，引用超出作用域或被重新赋值sys.getrefcount( )函数可以获得对象的当前引用计数多数情况下，引用计数比你猜测得要
复制链接

扫一扫

专栏目录