python中的一些概念小结(爬虫方面为主的)

进程:资源分配的最小单位

线程:资源执行的最小单位

进程的状态:新建-就绪-运行-死亡 新建-就绪-运行-挂起-就绪-运行-死亡 新建-就绪-运行-阻塞-死亡

并发:是指两个或多个事件在同一时间间隔内发生

并行:指两个或者多个事件在同一时刻发生

同步:多任务,多个任务之间执行的时候要求有先后顺序,必须一个先执行完成之后,另一个才能继续执行, 只有一个主线。经典案例(生产者与消费者模式)

异步: 多任务, 多个任务之间执行没有先后顺序,可以同时运行,执行的先后顺序不会有什么影响,存在的多条运行主线。

数据结构:栈 堆 队列 数 链表(组成由内存域和数据域,内存域存储的是连接的前一个数据的内存地址,特点是查询慢,增删快) 图 数组(利用索引,类似于字典,长度有限制,特点是查询快,增删慢) 哈希表(散列表算法,可以理解为链表和数组特点的结合,内存值通过散列表算法算出哈希值,通过求余[%],余数就是该数在数组中的索引值,如出现相同的,o-a-y,会在数组中往后挤)

python作用域的规则:后来改成了LEGB。L: local(局部),  E: enclosure(闭包),  G: global(全局),  B: builtin(内建),【程序运行找变量是的顺序: L-E-G-B】

网络通信三要素:IP,端口号,通信协议(https/http等)

OSI模型把网络通信的工作分为7层,分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。客户端的工作流程:应用层-表示层-会话层-传输层-网络层-数据链路层-物理层 一层一层封装
服务端的工作流程:物理层-数据链路层-网络层-传输层-会话层-表示层-应用层 一层一层解析

可迭代对象(iterable):
可迭代对象实现了__iter__方法,该方法返回一个迭代器对象。
可以通过collections模块的Iterable类型判断

迭代器(iterator):
【迭代器有两个基本的方法:iter() 和 next()。】
迭代是Python最强大的功能之一,是访问集合元素的一种方式。

迭代器是一个可以记住遍历的位置的对象。

迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。

结束通过 StopIteration 异常标识迭代的完成

生成器(generator):生成器是一种特殊的迭代器,它的返回值不是通过return而是用yield。
【在Python中,这种一边循环一边计算的机制,称为生成器(Generator)。优点是节省内存】

在 Python 中,使用了 yield 的函数被称为生成器(generator)。

跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。

在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。

调用一个生成器函数,返回的是一个迭代器对象。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值