- 博客(52)
- 收藏
- 关注
原创 Python实现微信定时自动发送指定群消息
随着时代的快速发展,人们追求更加简单便捷的方式。微信客服每天都要回复并发送各种消息,尤其是当商品出现优惠时,需要及时把消息发送到群里。为了追求更加便捷的方式,在此基于Python编写了一个实现微信定时自动发送指定群消息。这里有两个文件,一个是主程序main.py,一个文本文件(txt)。txt是用来放入指定群聊名称,设置定时时间,编辑发送的消息内容。运行程序后,程序会自动监测当前时间,当时间正好为所设定的时间。程序就会弹出微信,给指定群发送消息并@所有人。
2024-02-26 23:49:16 1623
原创 Python进阶--查询商品历史价格(基于慢慢买比价网的爬虫)
本贴将学习一个抓取商品历史价格的案例。 目前,各大电商平台存在着同一商品价格不一的现象。商品历史价格爬虫可以获取同一商品在各个平台的历史价格,并通过历史价格预测出近期可能的降价空间。
2024-02-26 23:21:54 3103 2
原创 网页数据的存储--存储为文本文件(TXT、JSON、CSV)
用解析器解析出数据后,接下来就是存储数据了。数据的存储有多种多样,其中最简单的一种是将数据直接保存为文本文件,如TXT、JSON、CSV等。这里就介绍将数据直接保存为文本文件。
2024-02-23 23:57:32 1894
原创 网页数据的解析提取(parsel库的使用)
前面,我们已经介绍了Xpath库和Beautiful Soup库(支持css选择器)来提取页面信息。它们有各自的优缺点,那可不可以取长补短呢?当然可以,parsel库就是结合Xpath和css选择器两种方式来提取网页信息。同时,Python爬虫有一个最流行的Scrapy框架,parsel就是它的底层支持。了解了它,后面学习Scrapy选择器的用法就非常方便了!!!
2024-02-23 15:42:11 1120
原创 多任务爬虫(多线程和多进程)
在一台计算机中,我们可以同时打开多个软件,例如同时浏览网页、听音乐、打字等,这是再正常不过的事情。但仔细想想,为什么计算机可以同时运行这么多软件呢?这就涉及计算机中的两个名词:多进程和多线程。同样,在编写爬虫程序的时候,为了提高爬取效率,我们可能会同时运行多个爬虫任务,其中同样涉及多进程和多线程。一、多线程的概念说起多线程,就不得不先说什么是线程。说起线程,又不得不先说什么是进程。进程可以理解为一个可以独立运行的程序单位,例如打开一个浏览器,就开启了一个浏览器进程;
2024-02-22 23:52:55 1658 1
原创 网页数据的解析提取(Beautiful Soup库详解)
简单来说, Beautiful Soup 是 Python的一个 HTML 或XML 的解析库, 我们用它可以方便地从网页中提取数据, 其官方解释如下:Beautiful Soup 提供一些简单的、Python 式的函数来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据, 因为简单, 所以无须很多代码就可以写出一个完整的应用程序。Beautiful Soup 自动将输入文档转换为Unicode 编码, 将输出文档转换为 utf-8编码。
2024-02-22 21:38:21 1712
原创 爬虫基本库的使用(httpx库的详细解析)
前面,已经介绍过了urllib库和requests库(),已经可以爬取大多数网站的数据。但对于某些网站依然无能为力 ,因为这些网站强制使用HTTP/2.0协议访问,而urllib库和requests库只支持HTTP/1.1协议。那碰上这种情况应该怎么办呢?只需要使用支持HTTP/2.0协议的请求库不就好了。目前,应用比较广泛的是hyper和httpx。但httpx用起来更方便而且也更强大,requests库的功能它几乎都支持。那么,这里就详细来介绍httpx库吧!!!
2024-02-22 12:22:53 2217 2
原创 网页数据的解析提取(正则表达式----re库详解)
前面,我们已经可以用requests库来获取网页的源代码,得到HTML代码。但我们真正想要的数据是包含在HTML代码之中的。要怎样才能从HTML代码中获取想要的信息呢?正则表达式是一个万能的方法!!!
2024-02-21 23:51:23 1627
原创 爬虫基本库的使用(requests库的详细解析)
前面,我们了解了urllib库的基本用法(其中,确实又不方便的地方。例如处理网页验证和Cookie时,需要写Opener类和Handler类来处理。另外实现POST、PUT等请求时的写法也不太方便。为了更加方便地实现这些操作,产生了更为强大的库----requests。有了它,Cookie、登录验证、代理设置更加方便。(request库是爬虫请求网页最为常用的库!!!因为它更加方便!!!哇,今天又是深爱Python的一天!!!
2024-02-21 16:31:15 1197
原创 网页数据的解析提取(XPath的使用----lxml库详解)
在提取网页信息时,最基础的方法是使用正则表达式,但过程比较烦琐且容易出错。对于网页节点来说,可以定义id、class或其他属性,而且节点之间还有层次关系,在网页中可以通过XPath或CSS选择器来定位一个或多个节点。那么,在解析页面时,利用XPath或CSS选择器提取某个节点,然后调用相应方法获取该节点的正文内容或者属性,就可以提取我们想要的任意信息了。在Python中,如何实现上述操作呢?
2024-02-20 23:02:36 1681
原创 爬虫基本库的使用(urllib库的详细解析)
学习爬虫,其基本的操作便是模拟浏览器向服务器发出请求,那么我们需要从哪个地方做起呢?请求需要我们自己构造吗?我们需要关心请求这个数据结构怎么实现吗?需要了解 HTTP、TCP、IP层的网络传输通信吗?需要知道服务器如何响应以及响应的原理吗?可能你无从下手,不过不用担心,Python的强大之处就是提供了功能齐全的类库来帮助我们实现这些需求。最基础的 HTTP 库有 urllib、requests、httpx等。(由于篇幅限制,本帖只讲解urllib库,Request和httpx后续会陆续更新)
2024-02-20 20:01:28 1862
原创 Python高级进阶--多线程爬取下载小说(基于笔趣阁的爬虫程序)
本帖将详细演示爬取笔趣阁中的一本小说,将其下载到本地。内容详实,代码详解。对爬虫感兴趣的小伙伴们和新手小白都可进入学习!学会之后,可以爬取自己感兴趣的小说内容!!!
2024-02-11 22:55:13 3369 2
原创 Python进阶--爬取美女图片壁纸(基于回车桌面网的爬虫程序)
爬取美女图片,详细解释每一个步骤,满足各种下载需求,给出所有源代码,小白也能看懂!!!
2024-02-08 17:52:56 5501 2
原创 Python进阶--下载想要的格言(基于格言网的Python爬虫程序)
基于格言网,爬取想要的内容。只用输入想爬取的部分,即可下载。内容详实,代码有详细注释,小白也能看懂!!!
2024-02-06 23:51:40 1813
原创 Python进阶--爬取下载人生格言(基于格言网的Python3爬虫)
爬取人生格言,详细解释每一个步骤,代码中有详细注解。对爬虫感兴趣的小伙伴们,可以来学习!!!这是一个非常不错的爬虫实例!!!
2024-02-06 17:09:46 1055
原创 PYthon进阶--网页采集器(基于百度搜索的Python3爬虫程序)
基于百度搜索引擎的PYthon3爬虫程序的网页采集器,小白和爬虫学习者都可以学会。运行爬虫程序,输入关键词,即可将所搜出来的网页内容保存在本地。
2024-02-05 20:36:30 3724
原创 Python进阶----在线翻译器(Python3的百度翻译爬虫)
基于百度翻译的PYthon在线翻译爬虫程序,详细解释每一个步骤,对爬虫爱好者和小白学习非常友好。学会这个,可以自己基于其他翻译网站进行编写在线翻译爬虫程序,此处也可以出了基于搜狗翻译的PYthon在线翻译爬虫程序。
2024-02-05 13:14:00 3040
原创 DFS在树的遍历中的简单应用(4种遍历的互相求解)
树这种结构,我将在另一篇文章进行介绍。此处只讲解DFS在树的4种遍历中的简单应用,如:对于二叉树,已知先序、中序遍历求后序遍历;已知中序、后序遍历求先序遍历。对于完全二叉树,已知任意一种遍历则可以求出其他遍历。此处使用的存储结构是数组,并不采用树结构。
2023-04-18 17:06:49 1333
原创 天梯赛训练心得2
一种特殊情况是,因为筐的容量是有限的,当筐已经满了,但仍然有某条轨道的按钮被按下时,系统应强制启动 0 号键,先从筐里抓出一件物品,再将对应轨道的物品推落;注:所谓数列 { A1, ..., AM } 比 { B1, ..., BM } 大,是指存在 1≤i<M,使得 A1=B1,...,Ai=Bi 成立,且 Ai+1>Bi+1。在此假设给出的变异都是由突变引起的,不考虑复杂的基因重组变异问题 —— 即每一种病毒都是由唯一的一种病毒突变而来,并且不存在循环变异的情况。
2023-04-13 21:52:07 276
原创 L1-8 编程团体赛【数组的一种处理方式】
编程团体赛的规则为:每个参赛队由若干队员组成;所有队员独立比赛;参赛队的成绩为所有队员的成绩和;成绩最高的队获胜。现给定所有队员的比赛成绩,请你编写程序找出冠军队。
2023-04-10 21:38:06 149
原创 L1-5 6翻了【字符串改写处理方法】
666”是一种网络用语,大概是表示某人很厉害、我们很佩服的意思。最近又衍生出另一个数字“9”,意思是“6翻了”,实在太厉害的意思。如果你以为这就是厉害的最高境界,那就错啦 —— 目前的最高境界是数字“27”,因为这是 3 个 “9”!本题就请你编写程序,将那些过时的、只会用一连串“6666……6”表达仰慕的句子,翻译成最新的高级表达。
2023-04-10 21:25:35 103
原创 高精度除法
由于除数是一个全1的数,可以通过枚举一步步扩大,在扩大的同时也进行整除判断是否能整除。能整除就直接输出整除结果,不能整除就需要先将这部分结果先输出,然后整除取余,将被除数缩小,以免溢出。这里所谓的“光棍”,并不是指单身汪啦~ 说的是全部由1组成的数字,比如1、11、111、1111等。可能是个非常大的数 —— 比如,程序输入31,那么就输出3584229390681和15,因为31乘以3584229390681的结果是111111111111111,一共15个1。然后,经过计算,输出两个数字:第一个数字。
2023-04-10 21:16:53 86
原创 三足鼎立【转换成三角形三边】
L2-2 三足鼎立当三个国家中的任何两国实力之和都大于第三国的时候,这三个国家互相结盟就呈“三足鼎立”之势,这种状态是最稳定的。现已知本国的实力值,又给出 n 个其他国家的实力值。我们需要从这 n 个国家中找 2 个结盟,以成三足鼎立。有多少种选择呢?
2023-04-10 21:07:07 179
原创 【2023首届算法大赛部分题解】DFS的应用(幸运数字、帮助小强)
如果你被给予一个整数N,包含1到9的数字,你可以在这个整数的任意位置插入加号。可以在多个位置插入加号,或者一个也不插入,但是在一个位置上只能插入一个加号,不得连续插入多个加号。这样就能通过加法得到一个新的整数。请计算出按这种方法得到的所有整数的总和。小强前去面试一份工作。老板说,有个问题你如果能答上来,就能得到这份工作。老板说:“我不在乎你原来学了什么,我只在乎你能否快速掌握新知识。回家去再想想,如果明天能答上来,就直接来上班。打印输出按这种添加加号的方法得到的所有整数的总和。输入仅包含一个整数N。
2023-04-03 23:01:43 117
原创 信箱机制
分析消息及分发消息(分发给具体的窗口消息处理函数)间接消息传递模式(Windows中的消息处理)Receive原语(接收消息)Send原语(发送消息)
2023-01-29 17:36:39 75
Python实现微信定时自动向指定群发送消息(含源代码、可执行脚本及使用方法)
2024-02-27
操作系统思维导图【含word形式】【含原图链接】
2023-02-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人