- 博客(13)
- 收藏
- 关注
原创 python多线程万字详解!!!
一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。Lock锁是线程模块中的一个类,有两个主要方法:acquire()和release() 当调用acquire()方法时,它锁定锁的执行并阻塞锁的执行,直到其他线程调用release()方法将其设置为解锁状态。这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以,要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数。
2024-11-04 08:13:59 384
原创 python多进程万字详解!!!
当一个队列为空的时候如果再用get取则会阻塞,所以这时候就需要吧blocked设置为false,即非阻塞式,实际上它就会调用get_nowait()方法,此时还需要设置一个超时时间,在这么长的时间内还没有取到队列元素,那就抛出Queue.Empty异常。当生产者的生产能力远大于消费者的消费能力,生产者就需要等消费者消费完才能继续生产新的数据,同理,如果消费者的消费能力远大于生产者的生产能力,消费者就需要等生产者生产完数据才能继续消费,这种等待会造成效率的低下,为了解决这种问题就引入了生产者消费者模型。
2024-11-04 08:09:33 411
原创 urllib与requests模块一文足够了!!!
除了requests模块可以发送请求之外, urllib模块也可以实现请求的发送,只是操作方法略有不同!urllib在python中分为urllib和urllib2,在python3中为urllib下面以python3的urllib为例进行讲解构造简单请求#构造请求#发送请求获取响应传入headers参数#构造headersMSIE 9.0;#构造请求#发送请求传入data参数 实现发送post请求(示例)data = {'pid': '','keyword': '北京',
2024-11-03 07:57:46 436
原创 自动化爬虫-selenium模块万字详解
selenium本身是一个自动化测试工具。它可以让python代码调用浏览器。并获取到浏览器中加载的各种资源。我们可以利用selenium提供的各项功能。帮助我们完成数据的抓取。
2024-11-03 07:48:04 708
原创 python爬取m3u8视频(思路到实现全讲解!!!)
''''''# 正则抓取上面的源代码中的m3u8的url# 写入文件 分析当前的页面源代码# 写入response.content bytes二进制类型# 请求可以获取index.m3u8文件# 写入response.content bytes二进制类型# 拆分返回的内容获取真整的index.m3u8文件的url。
2024-11-02 14:20:28 617
原创 python中xpath模块详解!
XPath 是一门在 XML 文档中查找信息的语言。查找所有id属性等于head并且class属性等于s_down的div标签。html_tree = etree.HTML(html字符串)通过在路径表达式中使用“|”运算符,您可以选取若干个路径。谓语用来查找某个特定的节点或者包含某个指定的值的节点。选取文档中的所有 title 和 price 元素。查询所有id属性中包以he开头的div标签。查找所有div标签下的直接子节点h1的内容。查询所有id属性中包含he的div标签。
2024-11-02 08:17:06 380
原创 python并发+进程+线程编程超全讲解
并发编程是一项比较庞大而复杂并且非常重要的技术,无论在面试,还是工作中出现的频率非常高。而我们要学习并发编程,首先要清晰一些基本概念。1946年第一台计算机诞生–20世纪50年代中期,计算机工作还在采用手工操作方式。此时还没有操作系统的概念,属于第一代计算机。程序员将对应于程序和数据的穿孔卡片(punched card,就是一张纸卡片,这个纸卡片被分为N行M列的格子)装入输入机,然后启动输入机把程序和数据输入计算机内存,接着通过控制台开关启动程序针对数据运行;计算完毕,打印机输出计算结果;用户取走结果并穿孔
2024-11-02 08:10:54 972
原创 万字详解python中beautifulsoup模块!!!
简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,,所以不需要多少代码就可以写出一个完整的应用程序。
2024-11-01 14:30:19 657
原创 TF-IDF算法详解
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。
2024-10-31 17:46:35 703
原创 一文详解转置卷积(Transpose Convolution)
通常情况下,对图像进行卷积运算时,经过多层的卷积运算后,输出图像的尺寸会变得很小,即图像被削减。而对于某些特定的任务(比如:图像分割、GAN),我们需要将图像恢复到原来的尺寸再进行进一步的计算。这个恢复图像尺寸,实现图像由小分辨率到大分辨率映射的操作,叫做上采样(Upsample),如 图 所示。
2024-10-29 13:50:56 676
原创 适合小白体质的残差网络全讲解
最右侧是ResNet-34,命名为ResNet-34,是因为网络中7×7卷积层、3×3卷积层和全连接层共34层。在计算这个34层时,论文作者并没有将BatchNorm、ReLU、AvgPool以及Shortcut中的层考虑进去。右侧ResNet-34中的3×3卷积层的颜色不同,共4种颜色。每种颜色表示一个模块,由一组残差基础块组成,只不过残差基础块的数量不同,从上到下依次是。
2024-10-28 17:24:26 797
原创 c++写高性能的任务流线程池(万字详解!附完整github代码)
本文原是github开源项目MC_thread_pool的说明文档,原文发送在此,同时本文中所有代码均在github中有完整实现,查看代码请移步github仓库!
2024-10-10 17:43:21 1412
空空如也
Clion运行c++项目链接过程报错求解
2024-09-09
ctf中两个图片合在一起
2023-10-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人