python面试常见问题和数据分析师、算法工程师可能会问到的问题、简历的写法、自我定位等的认知

对本人转行做数据分析的一点探讨和面试遇到的情况

基本情况

我本科读机械设计制造及其自动化,暂时没有读研究生的想法,但非全日制的研究生个人蛮感兴趣,现在想找一份数据分析类的岗位,咨询了一些培训机构之后(建议找有保薪协议的,有些机构有就业服务,但也只是提供模拟面试和把你的岗位推过去给合作的企业,企业要不要你,全看他们企业方)。

在2021年12月初开始找工作,5月份开始学,6月份离职后全身心投入到学习培训机构提供的教学内容中,目前认为自己已经把想学习的相关技能都掌握了,想出去工作了,一天两场面试这样进行下来,到了12月中旬,得出的结果是:

转行做技术岗位难度比较大
我转行的跨度非常之大,而且没有相关的工作经验,能去面试已经算看的起我哈哈哈哈哈。别人宁愿要一个科班出身的应届生也不要你这个学习成绩在校内、在自己专业内能收到老师认可和同学赞赏和羡慕的人,隔行如隔山,各位转行也三思而后行。

面试结果

经过半个月的面试(会不会决定太快了,害,但我感觉有人肯收我都不错了,一开始把培训机构说的话想得太满,以为自己出去真的能找到一份不错薪资待遇的工作),找到一家试用期5k,双休,朝九晚六的工作。其他的也并不是没有开出比他还高的工资,只是要么大小周,要么单休,我想双休哈哈哈哈

关于初期工资和培训机构

工资这块,一开始你也别把培训机构和你说的xx城市的人均薪资水平如何当回事,他们能给你的数据也只是行业给你的数据,并不能说明你一开始就能拿到这样的工资,更何况你不是本专业相关的人,一定要去面试多一些,面试间隔紧凑一些,这样有回旋的余地,也能减少时间焦虑

也不知是找工作的时间问题还是机构的问题,年底他们机构合作招人的数据岗位企业少,何我心意的也只有一家,而且机构那边帮我推过去,消息也石沉大海,啧啧,真是耐人寻味

猎头找上门的免费培训

在面试期间,有猎头打电话过来声称可以给你提供20天(xx天)的免费培训,因为公司很依赖这样的人才,人才缺口很高,培训20天之后就可以获得内推的机会,拿到高薪高福利

  • 这个所谓的内推机会,可能和培训机构如出一辙
  • 培训是免费的,但可能是收费的项目名称不一样了,如和我联系那位,说进到企业找到工作之后,要给他一笔人才服务费1万2,这我就哈哈哈了,天下没有免费的午餐,一定要多问几句要在哪个时间节点会收你钱

职业定位

给自己定位是实习生还是出来工作了一两年的社会人才,这对公司来说就是形象的划分。

  • 如果是实习生,那么薪水方面可能会大打折扣,因为还要花时间去培养你,还要给你发工资
  • 如果已经是社会人才,那么他看待你的形象就是稍加培养

定位类型全凭自己,定位后,自己的简历侧重点(包括展示点和自我介绍点、话题围绕点)都要改变:

  • 如果是实习生,那么可以侧重于自己的校园里的成绩和成就,话题有关度可能也会倾向于校园生活,并且在简历中体现出来
  • 如果是职场人士,要侧重于自己的项目经历和经验
    • 这个是什么项目、如何立项、有什么困难、怎么克服、(有什么结果(对公司、对项目外界的影响等))

找工作的搜索技巧和如何对待岗位需求差异感(落差感)

  • 那数据分析师来做例子,并不是所有相似的岗位都叫数据分析师,在网上找的过程中,可以分开找,例如:单独搜数据,单独搜分析。

老板想要的是结果,并不在意你是拿什么工具来做的

  • 当有hr对你有意思并投来橄榄枝的时候,带来的岗位职责要求或许是不一样的,但人们有时候会觉得,他给我岗位职责要求不太一样,他怎么还招上门,我这些东西岂不是白学了。例如我本来是用python做数据分析的,这个hr给我的岗位要求中是用excel做的数据分析报告,会有岗位需求差异感,总结一句就是:过了海的就是神仙
    • 八仙过海,各显神通,过了海的就是神仙,按照上面的说法,既然hr已经来找你了,说明他对你的专业技能是有所了解的,了解过后他还来找你,他是认同你的
    • 你的专业技能只是你的敲门砖,以后未必会用得上,老板找的是做事的人,可能并不在乎你是怎么做出来的,我的老师给我举了一个例子:他的妹妹也学了python编程数据分析,去面试的时候,人家让她以后用excel做数据分析报表,妹妹直接打开手机给他们看自己编程的html文件,对于excel来说,能编程做数据分析简直是降维打击!,直接录用。
    • 多数从事某一行业工作的人,一开始并不是行业对口人才

对于机构推荐

  • 小心有坑,一些机构在劝你报班的时候,会和你说合作的企业有多少多少个

    • 注意一定要问清楚你所意向的这个班的行业对应的合作企业有哪些,在你生活的地方有多少个
    • 他的推荐形式是怎么样的:包分配进去?还是仅仅借机构之手帮你把简历投过去,他用不用你要等对方企业的电话?
    • 是否有薪资保障,我报班是为了更好的就业的,而不是去找些几千块的工作
    • 他和你说的是什么地方的薪资水平要说清楚,例如你在广州,你需要进一步问一下xx岗位的薪资水平和近期你们机构推荐成功入岗的这些学生的薪资水平如何
  • 机构技术老师给的建议是,如果走机构方找的企业,可能企业会觉得你能力一般才要靠机构帮你找工作,那么薪水方面可能会有一定的下降??按照技术老师的说法,有能力的人自己找的薪资大概率会比机构推荐过去的薪资高

    • 对于这种说法,我就有些疑惑了,当初不是你们打着企业合作的旗号,帮助企业找到并培养这样的人才吗?反倒是最后变成通过机构找到企业的岗位,薪水还比自己找的低?
    • 经过沟通,需要确认机构老师,就业老师,机构是否和你是站在同你这边的,可以同时在招聘软件和机构这边查看相同公司给出的薪水,如果是站在同一边的,给机构方的薪水低,就业办的老师应该和他们协商进一步沟通,这样就业老师的报表也能写的好看一些

关于简历

定位类型全凭自己,定位后,自己的简历侧重点(包括展示点和自我介绍点、话题围绕点)都要改变:

  1. 如果你既不是专业对口人才,学校也普通,停产学习技能(没有工作,自己上课),那你只剩下一个东西可以讲,就是项目经历
  • 奖项并非越多越好。简历上学校的东西要减少一些,奖项如果不是奖学金之类比较大的奖项和与面试的行业有关的奖项,尽量减少。
  • 自我评价部分也减少学校经历部分,面试时自己介绍时,校园经历简单概括即可
  • 写上去的东西一定要懂,不懂不要写。对于项目经历上写到技术能力和大概用途和用法一定要知道,不然就不用写上去,以免他来问你,你还一问三不知,因此写上去的技术能力你需要比较清楚,起答出来的大概答案是对的
  • 对项目经历的细节和关键点要记清楚这是可能是你跨行后一穷二白期间在面试过程中占据主动地位的关键,他一问你,你就开始滔滔不绝的讲到5分钟以上
  1. 项目的时间
    大项目的时间跨度可以长一些,一个项目一个月,不要挨的太近
  • 如果是报班学的,可以咨询一下老师如果一个人(假如经验尚浅)独自完成的话需要多久,不要挨得太紧
  • 一个项目做一个月是合理的
  • 你的工作经历和项目时间的重叠可能会引起话题。假如你是停产学习,这几月自己一个在干嘛,可能会问到,需要考虑一下
    • 说自己在做兼职的同时,继续学习?
  1. 项目的标题
    如果项目比较大众的话,标题建议换一下,例如搜索引擎推广“旅行青蛙”数据分析实战,如果旅行青蛙的实战项目比较多了,自己尝试换个名字重新大致地做一遍这个项目流程,以此类推

面试过程

是一个相互选择,相互博弈的过程,但有一点很重要,最好让自己占据主动权(主动画饼,讲饼):

  • 对面问一句,你答一句其实是对面占主动权,需要摆正自己的姿态,对方和你没有任何关系,甚至是骂他(说笑)都可以。他问你,你也可以问他
  • 不停的说。如果你既不是专业对口人才,学校也普通,停产学习技能(没有工作,自己上课),那你只剩下一个东西可以讲,就是项目经历,你要不停的说,不要给他说话的机会,给人印象很懂,滔滔不绝,因为他问的东西你不一定懂,所以不要给机会对方说话,他一问你,你就开始滔滔不绝的讲到5分钟以上:
    • 这个是什么项目、如何立项、有什么困难、怎么克服、(有什么结果(对公司、对项目外界的影响等))

自我介绍

  • 介绍过程中的重点是,不要说自己是买课学的,就说自学,不要出现机构字眼,干脆不说,一般企业会认为买课的人不如自学的厉害
    • 企业招人的优先顺序是:本专业>自学成才>报班学习
    • 要说成是自己自学,自己掌握的知识是靠自己努力学习得来的
  • 介绍时按照自己的定位给他们介绍,如果把自己定位职场人人,就着重于自己的工作经历和项目经历

面试的间隔

  • 面试是博弈和筛选的过程,谁也不能保证下一家公司会不会更好,对于这个问题,只能自己衡量斟酌,这也是为什么把面试放的这么密集的原因之一
  • 一天下来两三场面试没有关系,重在积累经验

1-10

1、一行代码实现1–100之和

# 1、一行代码实现1--100之和

sum(range(1,101))

在这里插入图片描述
2、如何在一个函数内部修改全局变量

# 2、如何在一个函数内部修改全局变量
# 利用global在函数声明 修改全局变量

a = 6
def cos():
    global a
    a =4
    
cos()
print(a)

在这里插入图片描述
3、列出5个python标准库
os:提供了不少与操作系统相关联的函数
sys: 通常用于命令行参数
re: 正则匹配
math: 数学运算
datetime:处理日期时间

4、字典如何删除键和合并两个字典

# 4、字典如何删除键和合并两个字典
# del和update方法

dic = {'n':'da','g':'asd','f':'ae'}

dic2 = {'b':'sdf','k':'aef','l':'thn'}

del dic['n']
dic.update(dic2)

dic

在这里插入图片描述
5、谈下python的GIL
GIL 是python的全局解释器锁,同一进程中假如有多个线程运行,一个线程在运行python程序的时候会霸占python解释器(加了一把锁即GIL),使该进程内的其他线程无法运行,等该线程运行完后其他线程才能运行。如果线程运行过程中遇到耗时操作,则解释器锁解开,使其他线程运行。所以在多线程中,线程的运行仍是有先后顺序的,并不是同时进行。
多进程中因为每个进程都能被系统分配资源,相当于每个进程有了一个python解释器,所以多进程可以实现多个进程的同时运行,缺点是进程系统资源开销大

6、python实现列表去重的方法

# 6、python实现列表去重的方法
# 先通过集合去重,在转列表

list = [12,43,7,89,234,667,56,67,67,34,43]

a = set(list)
a # {7, 12, 34, 43, 56, 67, 89, 234, 667}

list = [i for i in a]
list

在这里插入图片描述
7、fun(args,**kwargs)中的args,**kwargs什么意思?

# 7fun(*args,**kwargs)中的*args,**kwargs什么意思?
# *args和**kwargs主要用于函数定义。你可以将不定数量的参数传递给一个函数。
# 这里的不定的意思是:预先并不知道,函数使用者会传递多少个参数给你所以在这个场景下使用这两个关键字。
# *args是用来发送一个非键值对的可变数量的参数列表给一个函数.

def d(args_a,*args_b):
    print(args_a)
    for i in args_b:
        print(i)
        
d('a','b','y','y','k')

在这里插入图片描述

# **kwargs允许你将不定长度的键值对,作为参数传递给一个函数。
# 如果你想要在一个函数里处理带名字的参数,你应该使用**kwargs。

def f(**args):
    for i,j in args.items():
        print(i,j)

f(a = 'bab')

在这里插入图片描述
8、python2和python3的range(100)的区别

# 8、python2和python3的range(100)的区别
# python2返回列表,python3返回迭代器,节约内存

# 当后面没有元素可以next的时候,弹出错误
list = [1,2,45,5,64]
it = iter(list)
next(it) # 1
next(it) # 2
next(it) # 45
next(it) # 5
next(it) # 64
# next(it) # StopIteration                             Traceback (most recent call last)

# list、dict、str等是可迭代的但不是迭代器,因为next()函数无法调用它们。可以通过iter()函数将它们转换成迭代器。

在这里插入图片描述

list、dict、str等是可迭代的但不是迭代器,因为next()函数无法调用它们。可以通过iter()函数将它们转换成迭代器。

9、一句话解释什么样的语言能够用装饰器?
函数可以作为参数传递的语言,可以使用装饰器

10、python内建数据类型有哪些
整型–int
布尔型–bool
字符串–str
列表–list
元组–tuple
字典–dict

11-20

11、简述面向对象中__new__和__init__区别

# 11、简述面向对象中__new__和__init__区别
# __init__是初始化方法,创建对象后,就立刻被默认调用了,可接收参数

class Man(object):
    def __init__(self,eyes,legs):
        self.eyes = eyes
        self.legs = legs
        
    def run(self):
        print('人会跑')
        
m = Man(2,2)
print('人的眼睛数量:%d'%m.eyes)
print('人的腿数量:%d'%m.legs)
1、__new__至少要有一个参数cls,代表当前类,此参数在实例化时由Python解释器自动识别
2、__new__必须要有返回值,返回实例化出来的实例,这点在自己实现__new__时要特别注意,可以return父类(通过super(当前类名, cls))__new__出来的实例,或者直接是object的__new__出来的实例
3、__init__有一个参数self,就是这个__new__返回的实例,__init__在__new__的基础上可以完成一些其它初始化的动作,__init__不需要返回值
4、如果__new__创建的是当前类的实例,会自动调用__init__函数,通过return语句里面调用的__new__函数的第一个参数是cls来保证是当前类实例,如果是其他类的类名,;那么实际创建返回的就是其他类的实例,其实就不会调用当前类的__init__函数,也不会调用其他类的__init__函数。

class A(object):
    def __init__(self):
        print('init方法',self)
        
    def __new__(cls):
        print('cls的ID',id(cls))  
        print('new方法',object.__new__(cls))
        return object.__new__(cls)
    
A()
print('类A的ID',id(A))

# cls的ID 1831505335528  # cls和类ID一样,说明指向同一个类,也就是说cls就是创建的实例类
# new方法 <__main__.A object at 0x000001AA6FE97988>  # self和new方法返回地址一样,说明返回值是对象
# init方法 <__main__.A object at 0x000001AA6FE97988>
# 类A的ID 1831505335528

在这里插入图片描述
12、简述with方法打开处理文件帮我我们做了什么?

# 12、简述with方法打开处理文件帮我我们做了什么?

f = open('./1.txt','wb')
try:
    f.write('hello world')
except:
    pass
finally:
    f.close()
    
# 打开文件在进行读写的时候可能会出现一些异常状况,如果按照常规的f.open
# 写法,我们需要try,except,finally,做异常判断,并且文件最终不管遇到什么情况,都要执行finally f.close()关闭文件,with方法帮我们实现了finally中f.close
# (当然还有其他自定义功能,有兴趣可以研究with方法源码)

在这里插入图片描述

13、列表[1,2,3,4,5],请使用map()函数输出[1,4,9,16,25],并使用列表推导式提取出大于10的数,最终输出[16,25]

# 13、列表[1,2,3,4,5],请使用map()函数输出[1,4,9,16,25],并使用列表推导式提取出大于10的数,最终输出[16,25]
# map()函数第一个参数是fun,第二个参数是一般是list,第三个参数可以写list,也可以不写,根据需求

li = [1,2,3,4,5]

def f(x):
    return x**2

re = map(f,li)
re # <map at 0x1aa6fe9e648>

r = [i for i in re if i > 10]
r

在这里插入图片描述
14、python中生成随机整数、随机小数、0–1之间小数方法

# 14、python中生成随机整数、随机小数、0--1之间小数方法
# 随机整数:random.randint(a,b),生成区间内的整数
# 随机小数:习惯用numpy库,利用np.random.randn(5)生成5个随机小数
# 0-1随机小数:random.random(),括号中不传参

import random
import numpy as np

r1 = random.randint(1,130)
r2 = np.random.randn(5)
r3 = random.random()

print('整数',r1)
print('随机小数',r2)
print('0-1之间小数',r3)

在这里插入图片描述

15、避免转义给字符串加哪个字母表示原始字符串?
r , 表示需要原始字符串,不转义特殊字符

16、

中国
,用正则匹配出标签里面的内容(“中国”),其中class的类名是不确定的

# 16<div class="nam">中国</div>,用正则匹配出标签里面的内容(“中国”),其中class的类名是不确定的

import re
str = '<div class="nam">中国</div>'
res = re.findall(r'<div class=".*">(.*?)</div>',str)
print(res)

在这里插入图片描述
17、python中断言方法举例

# 17、python中断言方法举例
# assert()方法,断言成功,则程序继续执行,断言失败,则程序报错

a = 4
assert(a>1),'断言失败'
print('断言成功,继续执行')
# 断言成功,继续执行

b = 6
assert(b>10),'断言失败'
print('失败了')
# AssertionError: 断言失败

在这里插入图片描述
18、数据表student有id,name,score,city字段,其中name中的名字可有重复,需要消除重复行,请写sql语句

# 18、数据表student有id,name,score,city字段,其中name中的名字可有重复,需要消除重复行,请写sql语句
# select distinct name from student

19、10个Linux常用命令

# 1910个Linux常用命令
# ls pwd cd touch rm mkdir tree cp mv cat more grep echo

20、python2和python3区别?列举5个

  • 1、Python3 使用 print 必须要以小括号包裹打印内容,比如 print(‘hi’)
    Python2 既可以使用带小括号的方式,也可以使用一个空格来分隔打印内容,比 如 print ‘hi’
  • 2、python2 range(1,10)返回列表,python3中返回迭代器,节约内存
  • 3、python2中使用ascii编码,python中使用utf-8编码
  • 4、python2中unicode表示字符串序列,str表示字节序列
    python3中str表示字符串序列,byte表示字节序列
  • 5、python2中为正常显示中文,引入coding声明,python3中不需要
  • 6、python2中是raw_input()函数,python3中是input()函数

21-30

21、列出python中可变数据类型和不可变数据类型,并简述原理

# 21、列出python中可变数据类型和不可变数据类型,并简述原理
# 不可变数据类型:数值型、字符串型string和元组tuple
# 不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象(一个地址),如下图用id()方法可以打印对象的id

a = 3
b = 3 
id(a) # 140721860017280
id(b) # 140721860017280

# 可变数据类型:列表list和字典dict;
# 允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。

c = [1,3]
d = [1,3]
id(c) #  1831536943816
id(d) # 1831532397448

在这里插入图片描述
22、s = “ajldjlajfdljfddd”,去重并从小到大排序输出"adfjl"

# 22、s = "ajldjlajfdljfddd",去重并从小到大排序输出"adfjl"
# set去重,去重转成list,利用sort方法排序,reverse=False是从小到大排
# list是不 变数据类型,s.sort时候没有返回值,所以注释的代码写法不正确

aa = 'ajldjlajfdljfddd'
bb = set(aa)
bb

cc = list(bb)
cc

在这里插入图片描述
23、用lambda函数实现两个数相乘

# 23、用lambda函数实现两个数相乘

sum = lambda x,y:x*y
print(sum(5,6))

在这里插入图片描述
24、字典根据键从小到大排序

# 24、字典根据键从小到大排序
dic={"name":"zs","age":18,"city":"深圳","tel":"1362626627"}

# lis = sorted(dic) # ['age', 'city', 'name', 'tel']
lis = sorted(dic.items(),key=lambda i:i[0],reverse=False)
lis
# 字典化
dict(lis)

在这里插入图片描述
25、利用collections库的Counter方法统计字符串每个单词出现的次数"kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"

# 25、利用collections库的Counter方法统计字符串每个单词出现的次数"kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"

from collections import Counter
a = "kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"
res = Counter(a)
print(res)

在这里插入图片描述
26、字符串a = “not 404 found 张三 99 深圳”,每个词中间是空格,用正则过滤掉英文和数字,最终输出"张三 深圳"

# 26、字符串a = "not 404 found 张三 99 深圳",每个词中间是空格,用正则过滤掉英文和数字,最终输出"张三 深圳"

import re
a = "not 404 found 张三 99 深圳"

li = a.split(' ')
print(li) # ['not', '404', 'found', '张三', '99', '深圳']


res = re.findall('\d+|[a-zA-Z]+',a)
print(res) # ['not', '404', 'found', '99']

for i in res:
    if i in li:
        li.remove(i)
        
print(li) # ['张三', '深圳']
new = ' '.join(li)
print(new) # 张三 深圳

print('============================')
# 贴上匹配小数的代码,虽然能匹配,但是健壮性有待进一步确认

res2 = re.findall('\d+\.?\d*|[a-zA-Z]+',a)
print(res2) # ['not', '404', 'found', '99']

for i in res2:
    if i in li:
        li.remove(i)
        

new2 = ' '.join(li)
print(new2) # 张三 深圳

在这里插入图片描述

27、filter方法求出列表所有奇数并构造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# 27、filter方法求出列表所有奇数并构造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# filter() 函数用于过滤序列,过滤掉不符合条件的元素,
# 返回由符合条件元素组成的新列表。
# 该接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判,
# 然后返回 True 或 False,最后将返回 True 的元素放到新列表

# 方法1
def double(a):
    return a%2 == 1

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

list1 = filter(double,a)
list1 # 返回地址 <filter at 0x1aa76b41648>
new_list = [i for i in list1]
new_list

在这里插入图片描述
28、列表推导式求列表所有奇数并构造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# 28、列表推导式求列表所有奇数并构造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
res = [i for i in a if i%2 ==1]
res

在这里插入图片描述
29、正则re.complie作用
re.compile是将正则表达式编译成一个对象,加快速度,并重复使用
30、a=(1,)b=(1),c=(“1”) 分别是什么类型的数据?

# 30、a=1,)b=(1),c=("1") 分别是什么类型的数据?

a=(1,0)
b=(1)
c=("1")
print(type(a))
print(type(b))
print(type(c))

在这里插入图片描述

31-40

31、两个列表[1,5,7,9]和[2,2,6,8]合并为[1,2,2,3,6,7,8,9]

# 31、两个列表[1,5,7,9][2,2,6,8]合并为[1,2,2,3,6,7,8,9]
# extend可以将另一个集合中的元素逐一添加到列表中,区别于append整体添加

l1 = [1,5,7,9]
l2 = [2,2,6,8]

l1.extend(l2)
l1.sort(reverse=False)
l1

在这里插入图片描述

32、用python删除文件和用linux命令删除文件方法
python:os.remove(文件名)
linux: rm 文件名

33、log日志中,我们需要用时间戳记录error,warning等的发生时间,请用datetime模块打印当前时间戳 “2018-04-01 11:38:54”

# 33、log日志中,我们需要用时间戳记录error,warning等的发生时间,请用datetime模块打印当前时间戳 “2018-04-01 11:38:54”
# 顺便把星期的代码也贴上了

import datetime
# now_time = datetime.datetime.now().strftime('%y-%m-%d %H:%M:%S')
# day = datetime.datetime.now().isoweekday()
# type(day) # int
# now_time
total = str(datetime.datetime.now().strftime('%y-%m-%d %H:%M:%S'))+'星期:'+str(datetime.datetime.now().isoweekday())
# 已放错误调试文件中

在这里插入图片描述
34、数据库优化查询方法
外键、索引、联合查询、选择特定字段等等

35、请列出你会的任意一种统计图(条形图、折线图等)绘制的开源库,第三方也行
pyecharts、matplotlib

# 36、写一段自定义异常代码
# 自定义异常用raise抛出异常

def c():
    try:
        for i in range(6):
            if i > 4:
                raise Exception('数字大于4了')
    except Exception as ret:
        print(ret)
        
c()

在这里插入图片描述
37、正则表达式匹配中,(.)和(.?)匹配区别?

# 37、正则表达式匹配中,(.*)和(.*?)匹配区别?
# (.*)是贪婪匹配,会把满足正则的尽可能多的往后匹配
# (.*?)是非贪婪匹配,会把满足正则的尽可能少匹配

import re
s = '<a>哈哈</a><a>嘿嘿</a>'
r1 = re.findall('<a>(.*)</a>',s)
print('贪婪匹配:',r1)
r2 = re.findall('<a>(.*?)</a>',s)
print('非贪婪匹配:',r2)

在这里插入图片描述
38、简述Django的orm
ORM,全拼Object-Relation Mapping,意为对象-关系映射
实现了数据模型与数据库的解耦,通过简单的配置就可以轻松更换数据库,而不需要修改代码只需要面向对象编程,orm操作本质上会根据对接的数据库引擎,翻译成对应的sql语句,所有使用Django开发的项目无需关心程序底层使用的是MySQL、Oracle、sqlite…,如果数据库迁移,只需要更换Django的数据库引擎即可
在这里插入图片描述
39、[[1,2],[3,4],[5,6]]一行代码展开该列表,得出[1,2,3,4,5,6]

# 39[[1,2],[3,4],[5,6]]一行代码展开该列表,得出[1,2,3,4,5,6]
# 列表推导式的骚操作

a = [[1,2],[3,4],[5,6]]
x = [j for i in a for j in i]
print(x)

print('===================')
# 还有更骚的方法,将列表转成numpy矩阵,通过numpy的flatten()方法,代码永远是只有更骚,没有最骚
import numpy as np 
b = np.array(a).flatten().tolist()
print(b)

在这里插入图片描述
40、x=“abc”,y=“def”,z=[“d”,“e”,“f”],分别求出x.join(y)和x.join(z)返回的结果

# 40、x="abc",y="def",z=["d","e","f"],分别求出x.join(y)和x.join(z)返回的结果
# join()括号里面的是可迭代对象,x插入可迭代对象中间,形成字符串,结果一致,有没有突然感觉字符串的常见操作都不会玩了
# 顺便建议大家学下os.path.join()方法,拼接路径经常用到,也用到了join,和字符串操作中的join有什么区别,该问题大家可以查阅相关文档,后期会有答案

x="abc"
y="def"
z=["d","e","f"]

m = x.join(y)
print(m)
print('=================')
b = x.join(z)
print(b)

在这里插入图片描述

41-50

41、举例说明异常模块中try except else finally的相关意义

# 41、举例说明异常模块中try except else finally的相关意义
# try..except..else没有捕获到异常,执行else语句
# try..except..finally不管是否捕获到异常,都执行finally语句

try:
    num = 100
    print(num)
except NameError as errorMsg:
    print('产生错误了:%s'%errorMsg)
else:
    print('没有捕获异常')
    
try:
    num = 100
    print(num)
except NameError as errorMsg:
    print('产生错误了:%s'%errorMsg)
finally:
    print('不管是否捕获到异常,都执行')
        

在这里插入图片描述
42、python中交换两个数值

# 42、python中交换两个数值

d,h = 3,5
print(d,h)
h,d = d,h
print(d,h)

在这里插入图片描述
43、举例说明zip()函数用法

# 43、举例说明zip()函数用法
# zip()函数在运算时,会以一个或多个序列(可迭代对象)做为参数,返回一个元组的列表。同时将这些序列中并排的元素配对。
# zip()参数可以接受任何类型的序列,同时也可以有两个以上的参数;当传入参数的长度不同时,zip能自动以最短序列长度为准进行截取,获得元组。

# 列表
a = [1,2]
b = [3,4]
r1 = [ i for i in zip(a,b)]
print(r1)

# 元组
a = (34,7)
b = (87,98)
r2 = [ i for i in zip(a,b)]
print(r2)

# 字符串
a = 'sd'
b = 'nrt'
r3 = [ i for i in zip(a,b)]
print(r3)

在这里插入图片描述
44、a=“张明 98分”,用re.sub,将98替换为100

# 44、a="张明 98分",用re.sub,将98替换为100

import re 
a="张明 98分"
ret = re.sub(r'\d+','100',a)
ret

在这里插入图片描述
45、写5条常用sql语句
show databases;
show tables;
desc 表名;
select * from 表名;
delete from 表名 where id=5;
update students set gender=0,hometown=“北京” where id=5

46、a="hello"和b="你好"编码成bytes类型

# 46、a="hello"和b="你好"编码成bytes类型

a="hello".encode()
b="你好".encode()
print(type(a),type(b))

在这里插入图片描述
47、[1,2,3]+[4,5,6]的结果是多少?

# 47[1,2,3]+[4,5,6]的结果是多少?
# 两个列表相加,等价于extend

a = [1,2,3]
b = [4,5,6]
c = a + b
c

在这里插入图片描述
48、提高python运行效率的方法
1、使用生成器,因为可以节约大量内存
2、循环代码优化,避免过多重复代码的执行
3、核心模块用Cython PyPy等,提高效率
4、多进程、多线程、协程
5、多个if elif条件判断,可以把最有可能先发生的条件放到前面写,这样可以减少程序判断的次数,提高效率

49、简述mysql和redis区别
redis: 内存型非关系数据库,数据保存在内存中,速度快
mysql:关系型数据库,数据保存在磁盘中,检索的话,会有一定的Io操作,访问速度相对慢

50、遇到bug如何处理
1、细节上的错误,通过print()打印,能执行到print()说明一般上面的代码没有问题,分段检测程序是否有问题,如果是js的话可以alert或console.log
2、如果涉及一些第三方框架,会去查官方文档或者一些技术博客。
3、对于bug的管理与归类总结,一般测试将测试出的bug用teambin等bug管理工具进行记录,然后我们会一条一条进行修改,修改的过程也是理解业务逻辑和提高自己编程逻辑缜密性的方法,我也都会收藏做一些笔记记录。
4、导包问题、城市定位多音字造成的显示错误问题

51-60

51、正则匹配,匹配日期2018-03-20

# 51、正则匹配,匹配日期2018-03-20
# url='https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462'
# 仍有同学问正则,其实匹配并不难,提取一段特征语句,用(.*?)匹配即可

url='https://sycm.taobao.com/bda/tradinganaly/overview/get_summary.json?dateRange=2018-03-20%7C2018-03-20&dateType=recent1&device=1&token=ff25b109b&_=1521595613462'

r1 = re.findall(r'dateRange=(.*?)%7C(.*?)&',url)
r1

在这里插入图片描述

52、list=[2,3,5,4,9,6],从小到大排序,不许用sort,输出[2,3,4,5,6,9]

# 52、list=[2,3,5,4,9,6],从小到大排序,不许用sort,输出[2,3,4,5,6,9]
# 利用min()方法求出最小值,原列表删除最小值,新列表加入最小值,递归调用获取最小值的函数,反复操作

list=[2,3,5,4,9,6]
new_list = []
def get_min(list):
    a = min(list)
    list.remove(a)
    new_list.append(a)
    if len(list) > 0:
        get_min(list)
    return new_list

new_list = get_min(list)
print(new_list)

在这里插入图片描述
53、写一个单列模式

# 53、写一个单列模式
# 因为创建对象时__new__方法执行,并且必须return 返回实例化出来的对象所cls.__instance是否存在,不存在的话就创建对象,存在的话就返回该对象,来保证只有一个实例对象存在(单列),打印ID,值一样,说明对象同一个

class Singleton(object):
    __instance = None
    
    def __new__(cls,age,name):
        #如果类属性 __instance的值为None.
        #那么就创建一个对象,并且赋值为这个对象的引用,保证下次调用这个方法时
        #能够知道之前已经创建过对象了,这样就保证了只有1个对象
        if not cls.__instance:
            cls.__instance= object.__new__(cls)
        return cls.__instance
    
a = Singleton(18,'daf')    
b = Singleton(3,'awe')

print(id(a)) # 2632687314376
print(id(b)) # 2632687314376

a.age = 19 # 给a指向的对象添加一个属性
print(b.age) # 获取b指向的对象的age属性

在这里插入图片描述
54、保留两位小数

# 54、保留两位小数
# 题目本身只有a="%.03f"%1.3335,让计算a的结果,为了扩充保留小数的思路,提供round方法(数值,保留位数)

a="%.03f"%1.3335
print(a,type(a))
b = round(float(a),1)
print(b)
c = round(float(a),2)
print(c)

在这里插入图片描述
55、求三个方法打印结果

# 55、求三个方法打印结果
# fn("one",1)直接将键值对传给字典;
# fn("two",2)因为字典在内存中是可变数据类型,所以指向同一个地址,传了新的额参数后,会相当于给字典增加键值对
# fn("three",3,{})因为传了一个新字典,所以不再是原先默认参数的字典

def fn(i,j,dic={}):
    dic[i] = j
    print(dic,id(dic))
    
fn("one",1) # 2632686093400
fn("two",2) # 2632686093400
fn("three",3,{}) # 2632685042968

在这里插入图片描述
56、列出常见的状态码和意义 200 OK 请求正常处理完毕 204 No Content 请求成功处理,没有实体的主体返回 206 Partial Content GET范围请求已成功处理 301 Moved Permanently 永久重定向,资源已永久分配新URI 302 Found 临时重定向,资源已临时分配新URI 303 See Other 临时重定向,期望使用GET定向获取 304 Not Modified 发送的附带条件请求未满足 307 Temporary Redirect 临时重定向,POST不会变成GET 400 Bad Request 请求报文语法错误或参数错误 401 Unauthorized 需要通过HTTP认证,或认证失败 403 Forbidden 请求资源被拒绝 404 Not Found 无法找到请求资源(服务器无理由拒绝) 500 Internal Server Error 服务器故障或Web应用故障 503 Service Unavailable 服务器超负载或停机维护

57、分别从前端、后端、数据库阐述web项目的性能优化 该题目网上有很多方法,我不想截图网上的长串文字,看的头疼,按我自己的理解说几点 前端优化: 1、减少http请求、例如制作精灵图 2、html和CSS放在页面上部,javascript放在页面下面,因为js加载比HTML和Css加载慢,所以要优先加载html和css,以防页面显示不全,性能差,也影响用户体验差

后端优化: 1、缓存存储读写次数高,变化少的数据,比如网站首页的信息、商品的信息等。应用程序读取数据时,一般是先从缓存中读取,如果读取不到或数据已失效,再访问磁盘数据库,并将数据再次写入缓存。 2、异步方式,如果有耗时操作,可以采用异步,比如celery 3、代码优化,避免循环和判断次数太多,如果多个if else判断,优先判断最有可能先发生的情况

数据库优化: 1、如有条件,数据可以存放于redis,读取速度快 2、建立索引、外键等

58、使用pop和del删除字典中的"name"字段,dic={“name”:“zs”,“age”:18}

# 58、使用pop和del删除字典中的"name"字段,dic={"name":"zs","age":18}

dic={"name":"zs","age":18}
dic.pop('name')
print(dic)

dic={"name":"zs","age":18}
del dic['name']
print(dic)

在这里插入图片描述

59、列出常见MYSQL数据存储引擎 InnoDB:支持事务处理,支持外键,支持崩溃修复能力和并发控制。如果需要对事务的完整性要求比较高(比如银行),要求实现并发控制(比如售票),那选择InnoDB有很大的优势。如果需要频繁的更新、删除操作的数据库,也可以选择InnoDB,因为支持事务的提交(commit)和回滚(rollback)。 MyISAM:插入数据快,空间和内存使用比较低。如果表主要是用于插入新记录和读出记录,那么选择MyISAM能实现处理高效率。如果应用的完整性、并发性要求比 较低,也可以使用。 MEMORY:所有的数据都在内存中,数据的处理速度快,但是安全性不高。如果需要很快的读写速度,对数据的安全性要求较低,可以选择MEMOEY。它对表的大小有要求,不能建立太大的表。所以,这类数据库只使用在相对较小的数据库表。

60、计算代码运行结果,得出[(“a”,1),(“b”,2),(“c”,3),(“d”,4),(“e”,5)]

# 60、计算代码运行结果,得出[("a",1),("b",2)("c",3),("d",4),("e",5)]
A = zip(('a','b','c','d','e'),(1,2,3,4,5))
A0 = dict(A)
A1 = range(10)
# [i for i in A0] # ['a', 'b', 'c', 'd', 'e']
A2 = [ i for i in A1 if i in A0]
A3 = [A0[s] for s in A0]
print(A0)
print(A1)
print(A2)
print(A3)

# 方法1
# print(list(zip(('a','b','c','d','e'),(1,2,3,4,5))))
# 已经在错误文件调试


在这里插入图片描述

61-70

61、简述同源策略 同源策略需要同时满足以下三点要求: 1)协议相同 2)域名相同 3)端口相同 http:http://www.test.com与https:http://www.test.com 不同源——协议不同 http:http://www.test.com与http:http://www.admin.com 不同源——域名不同 http:http://www.test.com与http:http://www.test.com:8081 不同源——端口不同 只要不满足其中任意一个要求,就不符合同源策略,就会出现“跨域”

62、简述cookie和session的区别 1,session 在服务器端,cookie 在客户端(浏览器) 2、session 的运行依赖 session id,而 session id 是存在 cookie 中的,也就是说,如果浏览器禁用了 cookie ,同时 session 也会失效,存储Session时,键与Cookie中的sessionid相同,值是开发人员设置的键值对信息,进行了base64编码,过期时间由开发人员设置 3、cookie安全性比session差

63、简述多线程、多进程 进程: 1、操作系统进行资源分配和调度的基本单位,多个进程之间相互独立 2、稳定性好,如果一个进程崩溃,不影响其他进程,但是进程消耗资源大,开启的进程数量有限制

线程: 1、CPU进行资源分配和调度的基本单位,线程是进程的一部分,是比进程更小的能独立运行的基本单位,一个进程下的多个线程可以共享该进程的所有资源 2、如果IO操作密集,则可以多线程运行效率高,缺点是如果一个线程崩溃,都会造成进程的崩溃 应用: IO密集的用多线程,在用户输入,sleep 时候,可以切换到其他线程执行,减少等待的时间 CPU密集的用多进程,因为假如IO操作少,用多线程的话,因为线程共享一个全局解释器锁,当前运行的线程会霸占GIL,其他线程没有GIL,就不能充分利用多核CPU的优势

64、简述any()和all()方法

# 64、简述any()all()方法
# any():只要迭代器中有一个元素为真就为真
# all():迭代器中所有的判断项返回都是真,结果才为真
# python中什么元素为假?
# 答案:(0,空字符串,空列表、空字典、空元组、None, False)

print(bool(0))
print(bool(""))
print(bool([]))
print(bool(()))
print(bool({}))
print(bool(None))

# 测试all()any()方法
print('==================')

a = [True,False]
print(any(a))
print(all(a))

b = ""
print(any(b))
print(all(b))

c = ['goood','dsf','asdf','r','']
print(any(c))
print(all(c))


在这里插入图片描述
65、IOError、AttributeError、ImportError、IndentationError、IndexError、KeyError、SyntaxError、NameError分别代表什么异常 IOError:输入输出异常 AttributeError:试图访问一个对象没有的属性 ImportError:无法引入模块或包,基本是路径问题 IndentationError:语法错误,代码没有正确的对齐 IndexError:下标索引超出序列边界 KeyError:试图访问你字典里不存在的键 SyntaxError:Python代码逻辑语法出错,不能执行 NameError:使用一个还未赋予对象的变量

66、python中copy和deepcopy区别

# 66、python中copy和deepcopy区别
# 1、复制不可变数据类型,不管copy还是deepcopy,都是同一个地址当浅复制的值是不可变对象(数值,字符串,元组)时和=“赋值”的情况一样,对象的id值与浅复制原来的值相同。

import copy

print('不可变数据类型')
a = '地方'
b = a
c = copy.copy(a)
d = copy.deepcopy(a)
print(a,id(a))
print(b,id(b))
print(c,id(c))
print(d,id(d))

# 2、复制的值是可变对象(列表和字典)
# 浅拷贝copy有两种情况:
# 第一种情况:复制的 对象中无 复杂 子对象,原来值的改变并不会影响浅复制的值,同时浅复制的值改变也并不会影响原来的值。原来值的id值与浅复制原来的值不同。
# 第二种情况:复制的对象中有 复杂 子对象 (例如列表中的一个子元素是一个列表), 改变原来的值 中的复杂子对象的值 ,会影响浅复制的值。
# 深拷贝deepcopy:完全复制独立,包括内层列表和字典
print('======================')
print('\n可变类型')
l1 = [1,2,[5,6]] 
a = copy.copy(l1)
b = copy.deepcopy(l1)
# 外层列表: [1,2,[5,6]] 
# 内层列表: [3,4]
# 复杂子对象: [3,4] 我们认为包含嵌套结构的内层列表(字典)为复杂子对象
# 简单子对象: 1,2

print('测试原始数据')
print('结果表明对于外层列表来说,三者是独立的对象')
print('原始',l1,id(l1)) # 2632687676296
print('原始',a,id(a)) # 2632687086920
print('原始',b,id(b)) # 2632686135624
print('=======================')
print('测试修改外层列表的简单子对象')
print('结果表明修改了原始list之后,a和b并没有随之改变,符合我们的正常逻辑,因为是三个不同的对象')
l1[0] = 9
print('测试1',l1,id(l1)) # 2632687676296
print('测试1',a,id(a)) # 2632687086920
print('测试1',b,id(b)) # 2632686135624
print('==================')
print('测试内层列表的值的修改,也就是测试复杂子对象的值的修改')
l1[2][1] = 49
print('测试2',l1,id(l1)) # 2632687493640
print('测试2',a,id(a)) # 2632687495880
print('测试2',b,id(b)) # 2632687676296
print('结果表明copy浅拷贝并没有真正将内层列表(字典)独立拷贝出来,导致修改了list内层列表(字典)后a的内层列表(字典)值也变了')
print('结果表明deepcopy深拷贝可以将内层列表和(字典)独立拷贝出来,所以b的内层列表(字典)值不变')

在这里插入图片描述
67、列出几种魔法方法并简要介绍用途 init:对象初始化方法 new:创建对象时候执行的方法,单列模式会用到 str:当使用print输出对象的时候,只要自己定义了str(self)方法,那么就会打印从在这个方法中return的数据 del:删除对象执行的方法

68、C:\Users\ry-wu.junya\Desktop>python 1.py 22 33命令行启动程序并传参,print(sys.argv)会输出什么数据? 文件名和参数构成的列表

69、请将[i for i in range(3)]改成生成器

# 69、请将[i for i in range(3)]改成生成器
# 生成器是特殊的迭代器,
# 1、列表表达式的【】改为()即可变成生成器
# 2、函数在返回值得时候出现yield就变成生成器,而不是函数了;
# 中括号换成小括号即可,有没有惊呆了

a = (i for i in range(4))

type(a)

在这里插入图片描述
68、C:\Users\ry-wu.junya\Desktop>python 1.py 22 33命令行启动程序并传参,print(sys.argv)会输出什么数据? 文件名和参数构成的列表
不会。。。

69、请将[i for i in range(3)]改成生成器

# 69、请将[i for i in range(3)]改成生成器
# 生成器是特殊的迭代器,
# 1、列表表达式的【】改为()即可变成生成器
# 2、函数在返回值得时候出现yield就变成生成器,而不是函数了;
# 中括号换成小括号即可,有没有惊呆了

a = (i for i in range(4))

type(a)

在这里插入图片描述
70、a = " hehheh ",去除收尾空格

# 70、a = " hehheh ",去除收尾空格
a = " hehheh "
a.strip()

在这里插入图片描述

71-80

# 71、举例sort和sorted对列表排序,list=[0,-1,3,-10,5,9]
# sort和sorted的区别

list=[0,-1,3,-10,5,9]
list.sort(reverse=False)
print('list.sort在list基础上修改,无返回值',list)
print('===========================')
list=[0,-1,3,-10,5,9]
r = sorted(list,reverse=False)
print('sorted有返回值,是新的list',list)
print('返回值',r)

在这里插入图片描述
72、对list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],使用lambda函数从小到大排序

# 72、对list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],使用lambda函数从小到大排序

foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4]
# a = sorted(foo) # [-20, -5, -4, -4, -2, 0, 2, 4, 8, 8, 9]
a1 = sorted(foo,key=lambda x:x)
print(a1)

在这里插入图片描述
73、使用lambda函数对list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],输出结果为[0,2,4,8,8,9,-2,-4,-4,-5,-20],正数从小到大,负数从大到小

# 73、使用lambda函数对list排序foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4],输出结果为
# [0,2,4,8,8,9,-2,-4,-4,-5,-20],正数从小到大,负数从大到小
# (传两个条件,x<0abs(x))

foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4]
a = sorted(foo,key=lambda x:(x<0,abs(x)))
print(a)

在这里插入图片描述
74、列表嵌套字典的排序,分别根据年龄和姓名排序

# 74、列表嵌套字典的排序,分别根据年龄和姓名排序
# foo = [{"name":"zs","age":19},{"name":"ll","age":54},
# {"name":"wa","age":17},{"name":"df","age":23}]

foo = [{"name":"zs","age":19},{"name":"ll","age":54},
       {"name":"wa","age":17},{"name":"df","age":23}]
print('age')
a = sorted(foo,key=lambda x:x['age'],reverse=True)
print(a)
print('=========================')
print('name')
b = sorted(foo,key=lambda x:x['name'],reverse=True)
print(b)

在这里插入图片描述
75、列表嵌套元组,分别按字母和数字排序

# 75、列表嵌套元组,分别按字母和数字排序

foo = [('zs',19),('ll',54),('wa',17),('df',23)]

a = sorted(foo,key=lambda x:x[0])
a
print('字母')
print(a)
print('==========================')
print('数字')
b = sorted(foo,key=lambda x:x[1],reverse=True)
b
print(b)

在这里插入图片描述
76、列表嵌套列表排序,年龄数字相同怎么办? 添加参数,按字母排序

# 76、列表嵌套列表排序,年龄数字相同怎么办? 添加参数,按字母排序

foo = [['zs',19],['ll',54],['wa',17],['df',23],['ny',23]]

a = sorted(foo,key=lambda x:(x[1],x[0]))
a

在这里插入图片描述
77、根据键对字典排序(方法一,zip函数)

# 77、根据键对字典排序(方法一,zip函数)

dic = {'name':'zs','sex':'man','city':'b'}
foo = zip(dic.keys(),dic.values())
print('zip压缩:',foo) # 返回对象
foo = [i for i in foo]
print('字典转成列表嵌套元组:',foo)
b = sorted(foo,key=lambda x:x[0])
print('根据键排序:',b)
new_dict = {i[0]:i[1] for i in b}
print('重新排序:',new_dict)
print('===============================')

# 根据键对字典排序(方法二,不用zip)
# 有没有发现dic.items和zip(dic.keys(),dic.values())都是为了构造列表嵌套字典的结构,
# 方便后面用sorted()构造排序规则

print('方法2:使用items()')
dic = {'name':'zs','sex':'man','city':'b'}
foo = dic.items()
print('items():',foo) # 返回对象
foo = [i for i in foo]
print('字典转成列表嵌套元组:',foo)
b = sorted(foo,key=lambda x:x[0])
print('根据键排序:',b)
new_dict = {i[0]:i[1] for i in b}
print('重新排序:',new_dict)
print('===============================')

在这里插入图片描述
79、列表推导式、字典推导式、生成器

# 79、列表推导式、字典推导式、生成器

import random
g_list = [i for i in range(10)]
print('列表推导式',g_list,type(g_list))

g_gen = (i for i in range(10))
print('列表推导式',g_gen,type(g_gen))

dic = {k:random.randint(5,43) for k in ['a','b','c','d','e']}
print('字典推导式',dic,type(dic))

在这里插入图片描述
80、最后出一道检验题目,根据字符串长度排序,看排序是否灵活运用

# 80、最后出一道检验题目,根据字符串长度排序,看排序是否灵活运用

s = ['av','add','ae','gawe','ger','y']
b = sorted(s,key=lambda x:len(x))
print(b)
s.sort(key=len)
print(s)

在这里插入图片描述

81-90

81、举例说明SQL注入和解决办法

# 81、举例说明SQL注入和解决办法
# 当以字符串格式化书写方式的时候,如果用户输入的有;+SQL语句,后面的SQL语句会执行,比如例子中的SQL注入会删除数据库demo

input_name = 'zs'
sql = 'select * from demo where name="%s"' % input_name
print('正常sql语句',sql)

input_name = 'zs;drop database demo'
sql = 'select * from demo where name="%s"' % input_name
print('sql注入语句',sql)

# 解决方式:通过传参数方式解决SQL注入
params = [input_name]
# count = cs1.execute('select * from goods where name=%s',params)

在这里插入图片描述
82、s=“info:xiaoZhang 33 shandong”,用正则切分字符串输出[‘info’, ‘xiaoZhang’, ‘33’, ‘shandong’]

# 82、s="info:xiaoZhang 33 shandong",用正则切分字符串输出['info', 'xiaoZhang', '33', 'shandong']
# |表示或,根据冒号或者空格切分
import re

s1 = "info:xiaoZhang 33 shandong"
r1 = re.split('\W+',s1)
print(r1)

在这里插入图片描述
83、正则匹配以http://163.com结尾的邮箱

# 83、正则匹配以http://163.com结尾的邮箱

import re
e_l = ['xiaoWang@163.com','xiaoWang@163.comheihei','.com.xiaoWang@qq.com']

for e in e_l:
    ret = re.match('[\w]{4,20}@163.com$',e)
    if ret:
        print('%s 是符合的邮件地址,匹配后的结果是:%s' %(e,ret))
    else:
        print('%s 不符合要求 ' % e)

在这里插入图片描述
84、递归求和

# 84、递归求和

def get_sum(num):
    if num >= 1:
        res = num+get_sum(num-1)
    else:
        res = 0
    return res

r = get_sum(20)
print(r)

在这里插入图片描述
85、python字典和json字符串相互转化方法

# 85、python字典和json字符串相互转化方法
# json.dumps()字典转json字符串,json.loads()json转字典

import json
dic = {'name':'zs'}
res = json.dumps(dic)
print(res,type(res))
ret = json.loads(res)
print(ret,type(ret))

在这里插入图片描述
86、MyISAM 与 InnoDB 区别:
1、InnoDB 支持事务,MyISAM 不支持,这一点是非常之重要。事务是一种高
级的处理方式,如在一些列增删改中只要哪个出错还可以回滚还原,而 MyISAM
就不可以了;
2、MyISAM 适合查询以及插入为主的应用,InnoDB 适合频繁修改以及涉及到
安全性较高的应用;
3、InnoDB 支持外键,MyISAM 不支持;
4、对于自增长的字段,InnoDB 中必须包含只有该字段的索引,但是在 MyISAM
表中可以和其他字段一起建立联合索引;
5、清空整个表时,InnoDB 是一行一行的删除,效率非常慢。MyISAM 则会重
建表;

87、统计字符串中某字符出现次数

# 87、统计字符串中某字符出现次数

str = '张三 李四 李四 是否 噶围观 李各位 四微分  个个 色 李四 李四 李四'
res = str.count('李四')
r2 = str.count('李')
print(res)
print(r2)

在这里插入图片描述
88、字符串转化大小写

# 88、字符串转化大小写

str = 'JPWEIJFIOddddwef'
print(str.upper())
print(str.lower())

在这里插入图片描述
89、用两种方法去空格

# 89、用两种方法去空格

print('方法1')
str = 'hello world ha ha wef '
res = str.replace(' ','')
print(res) # helloworldhahawef
print('========================')

print('方法2')
# l = str.split(' ')
# res = ''.join(l)
l = ''.join(str.split(' '))
print(l)

在这里插入图片描述
90、正则匹配不是以4和7结尾的手机号

# 90、正则匹配不是以47结尾的手机号

tels = ['13265304103','13265304104','13265304107','13265304102','13265304137','13265304103']

for t in tels:
    ret = re.match('1\d{9}[0-3,5-6,8-9]',t)
    if ret:
        print('想要的结果:',ret.group())
    else:
        print('%s 不是想要的手机号' % t)

在这里插入图片描述

91-100

91、简述python引用计数机制

# 91、简述python引用计数机制
# python垃圾回收主要以引用计数为主,标记-清除和分代清除为辅的机制,其中标记-清除和分代回收主要是为了处理循环引用的难题。
# 引用计数算法
# 当有1个变量保存了对象的引用时,此对象的引用计数就会加1
# 当使用del删除变量指向的对象时,如果对象的引用计数不为1,比如3,那么此时只会让这个引用计数减1,即变为2,当再次调用del时,变为1,如果再调用1次del,此时会真的把对象进行删除

import time 
class Animal(object):
#     创建对象后会自动被调用
    def __init__(self,name):
        print('__init__方法被调用')
        self.name = name
    
#     当对象被删除时,会自动被调用
    def __del__(self):
        print('__del__方法被调用')
        print('%s对象马上被干掉了。。。' % self.name)
        
cat =  Animal('霸王')
cat2 = cat
cat3 = cat
print(id(cat),id(cat2),id(cat3))
print('=== 马上删除cat对象')
del cat
print('=== 马上删除cat2对象')
del cat2
print('=== 马上删除cat3对象')
del cat3
print('程序2秒钟后结束')
time.sleep(2)

在这里插入图片描述
92、int(“1.4”),int(1.4)输出结果?

# 92int("1.4"),int(1.4)输出结果?
# int("1.4")报错,int(1.4)输出1

# int('1.4') # ValueError: invalid literal for int() with base 10: '1.4'
int(1.4)

在这里插入图片描述
93、列举3条以上PEP8编码规范 1、顶级定义之间空两行,比如函数或者类定义。 2、方法定义、类定义与第一个方法之间,都应该空一行 3、三引号进行注释 4、使用Pycharm、Eclipse一般使用4个空格来缩进代码

94、正则表达式匹配findall和search的区别
findall结果无需加group(),search需要加group()提取

在这里插入图片描述
95、正则匹配中文

# 95、正则匹配中文
t = '您好,额法尔,hell,hello,friends'
p = re.compile(r'[\u4e00-\u9fa5]')
r = p.findall(t)
print(r)

在这里插入图片描述
96、简述乐观锁和悲观锁
悲观锁, 就是很悲观,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会block直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。

乐观锁,就是很乐观,每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制,乐观锁适用于多读的应用类型,这样可以提高吞吐量

97、r、r+、rb、rb+文件打开模式区别
模式较多,比较下背背记记即可
在这里插入图片描述
98、Linux命令重定向 > 和 >>
Linux 允许将命令执行结果 重定向到一个 文件
将本应显示在终端上的内容 输出/追加 到指定文件中

> 表示输出,会覆盖文件原有的内容
>> 表示追加,会将内容追加到已有文件的末尾
用法示例:
将 echo 输出的信息保存到 1.txt 里echo Hello Python > 1.txt
将 tree 输出的信息追加到 1.txt 文件的末尾tree >> 1.txt

99、正则表达式匹配出对应网址

# 99、正则表达式匹配出<html><h1>http://www.itcast.cn</h1></html>
# 前面的<>和后面的<>是对应的,可以用此方法

url = ['<html><h1>http://www.itcast.cn</h1></html>','<h1>http://www.itcas.cn</h1>']
for i in url:
    ret = re.match(r'<(\w*)><(\w*)>.*?</\2></\1>',i)
    if ret:
        print('%s 是符合要求的标签'% ret.group())
    else:
        print('%s 不符合要求' % i)

在这里插入图片描述
100、python传参数是传值还是传址?(见第二十一题举例)
Python中函数参数是引用传递(注意不是值传递)。对于不可变类型(数值型、字符串、元组),因变量不能修改,所以运算不会影响到变量自身;而对于可变类型(列表字典)来说,函数体运算可能会更改传入的参数变量。

101-110

101、求两个列表的交集、差集、并集

# 101、求两个列表的交集、差集、并集

a = [1,2,3,4,5]
b = [1,4,5,7,34]
# 交集
jj1 = [i for i in a if i in b]
jj2 = list(set(a).intersection(set(b)))
print('交集1:',jj)
print('交集2:',jj2)

# 并集
bj = list(set(a).union(set(b)))
print('并集:',bj)

# 差集
cj_b_in_a = list(set(a).difference(set(b)))
cj_a_in_b = list(set(b).difference(set(a)))

print('差集:',cj_b_in_a,cj_a_in_b)

在这里插入图片描述
102、生成0-100的随机数

# 102、生成0-100的随机数
# random.random()生成0-1之间的随机小数,所以乘以100

import random
# 方法1
r1 = 100*random.random()
# 方法2
r2 = random.choice(range(0,101))
# 方法3
r3 = random.randint(1,100)
print(r1)
print(r2)
print(r3)

在这里插入图片描述
103、lambda匿名函数好处

# 103、lambda匿名函数好处
# 精简代码,lambda省去了定义函数,map省去了写for循环过程

a = ['微分','个','','','全微分','爱国心','微分','','我和我','我刚刚']
r1 = map(lambda x:'填充值' if x == '' else x,a)
r2 = list(r1)
print(r1)
print(r2)

在这里插入图片描述
104、常见的网络传输协议
UDP、TCP、FTP、HTTP、SMTP等等

105、单引号、双引号、三引号用法

# 105、单引号、双引号、三引号用法
# 1、单引号和双引号没有什么区别,不过单引号不用按shift,打字稍微快一点。表示字符串的时候,单引号里面可以用双引号,而不用转义字符,反之亦然。
print('11:','She said:"Yes." ')
print('12:',"She said: 'Yes.' ")
# 2、但是如果直接用单引号扩住单引号,则需要转义,像这样:
print( '2',' She said:\'Yes.\' ')
# 3、三引号可以直接书写多行,通常用于大段,大篇幅的字符串
print("""
hello
world
""" )

在这里插入图片描述
106、简述python引用计数机制

# 106、简述python引用计数机制
# python垃圾回收主要以引用计数为主,标记-清除和分代清除为辅的机制,其中标记-清除和分代回收主要是为了处理循环引用的难题。
# 引用计数算法
# 当有1个变量保存了对象的引用时,此对象的引用计数就会加1
# 当使用del删除变量指向的对象时,如果对象的引用计数不为1,比如3,那么此时只会让这个引用计数减1,即变为2,当再次调用del时,变为1,如果再调用1次del,此时会真的把对象进行删除

import time 
class Animal(object):
#     创建对象后会自动被调用
    def __init__(self,name):
        print('__init__方法被调用')
        self.name = name
    
#     当对象被删除时,会自动被调用
    def __del__(self):
        print('__del__方法被调用')
        print('%s对象马上被干掉了。。。' % self.name)
        
cat =  Animal('霸王')
cat2 = cat
cat3 = cat
print(id(cat),id(cat2),id(cat3))
print('=== 马上删除cat对象')
del cat
print('=== 马上删除cat2对象')
del cat2
print('=== 马上删除cat3对象')
del cat3
print('程序2秒钟后结束')
time.sleep(2)

在这里插入图片描述
107、HTTP请求中get和post区别
1、GET请求是通过URL直接请求数据,数据信息可以在URL中直接看到,比如浏览器访问;而POST请求是放在请求头中的,我们是无法直接看到的;
2、GET提交有数据大小的限制,一般是不超过1024个字节,而这种说法也不完全准确,HTTP协议并没有设定URL字节长度的上限,而是浏览器做了些处理,所以长度依据浏览器的不同有所不同;POST请求在HTTP协议中也没有做说明,一般来说是没有设置限制的,但是实际上浏览器也有默认值。总体来说,少量的数据使用GET,大量的数据使用POST。
3、GET请求因为数据参数是暴露在URL中的,所以安全性比较低,比如密码是不能暴露的,就不能使用GET请求;POST请求中,请求参数信息是放在请求头的,所以安全性较高,可以使用。在实际中,涉及到登录操作的时候,尽量使用HTTPS请求,安全性更好。

108、python中读取Excel文件的方法

# 108、python中读取Excel文件的方法
# 应用数据分析库pandas

import pandas as pd
df = pd.read_excel("shop.xlsx")
df

在这里插入图片描述
109、简述多线程、多进程
线程:
1、CPU进行资源分配和调度的基本单位,线程是进程的一部分,是比进程更小的能独立运行的基本单位,一个进程下的多个线程可以共享该进程的所有资源
2、如果IO操作密集,则可以多线程运行效率高,缺点是如果一个线程崩溃,都会造成进程的崩溃
应用:
IO密集的用多线程,在用户输入,sleep 时候,可以切换到其他线程执行,减少等待的时间
CPU密集的用多进程,因为假如IO操作少,用多线程的话,因为线程共享一个全局解释器锁,当前运行的线程会霸占GIL,其他线程没有GIL,就不能充分利用多核CPU的优势

110、python正则中search和match

# 110、python正则中search和match
import re 
a = '小明年龄23岁 工资10000'
# search匹配到第一个西配到的数据
a1 = re.search(r'\d+',a).group()
print('search结果:',a1)

a2 = re.findall(r'\d+',a)
# 满足正则,都匹配,不用加group
print('findall:',a2)

a3 = re.match('小明',a).group()
# 匹配以小明“开头的字符串,并匹配出小明
print('match结果:',a3)

a4 = re.match(r'\d+',a)
# 不加group是不对的
print('match不加group的结果:',a4)

a5 = re.match('工资',a)
# 工资不是字符串开头,匹配不到
print('match结果:',a5)

在这里插入图片描述

针对python数据分析岗可能问的一些问题

你写了什么上去,可能就会问什么,不懂的不要写上去

  • 21
    点赞
  • 190
    收藏
    觉得还不错? 一键收藏
  • 10
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值