- 博客(27)
- 收藏
- 关注
原创 Python爬虫之路(13)--re正则获取豆瓣Top250
re正则实战-豆瓣Top250 在上文我们讲解了re正则表达式在python中的各种应用,在本文我们将以下面的例子带着大家去看看在实战中是如何运用的。
2024-07-12 15:25:07 939
原创 Python爬虫之路(12.1)--正则表达式常见用法
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 正则表达式使用单个字符串来描述、匹配一系列匹配某个语法规则的字符串。本文讲解常用的场景。
2024-06-16 17:22:59 409
原创 Python爬虫之路(12)--re正则表达式
正则表达式 认识正则 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 正则表达式使用单个字符串来描述、匹配一系列匹配某个语法规则的字符串。
2024-06-16 17:19:30 1144
原创 Python爬虫之路(11)--BeautifulSoup解析并获取图片
根据示例,我们会发现通过bs4解析可以很快速的根据标签的特殊性得到我们想要的数据。但要注意,有时候我们得到的响应内容会与F12打开看到的不同,所有在发现没有拿到数据的时候请考虑我们得到的相应内容里面。
2024-06-16 17:16:45 560
原创 Python爬虫之路(11)--Bs4解析并获取图片
通过bs4解析可以很快速的根据标签的特殊性得到我们想要的数据。但要注意,有时候我们得到的响应内容会与F12打开看到的不同,所有在发现没有拿到数据的时候,请考虑我们得到的相应内容里面究竟是什么样子的。
2024-06-04 17:51:25 607
原创 Python爬虫之路(10)--BeautifulSoup解析
在前面两篇文章,我们讲解了如何使用xpath解析去提取数据。本文将继续讲解另一种提取方法---**BeautifulSoup**,也叫做bs4解析。
2024-06-03 18:52:14 1211
原创 Python爬虫之路(9)--an居客数据获取
安居客网站的房间各种数据获取。在前文当中,我们学习了xpath解析,本文讲利用xpath对安居客进行数据分析与提取的解析。
2024-06-02 21:08:37 1628
原创 Python爬虫之路(8)--xpath解析内容进行数据提取
在前面的文章当中,已经教大家如何去获取我们需要的数据原文内容,今天就介绍一个用于提取所需数据的方法之一xpath解析。
2024-06-02 21:04:42 1677
原创 Python爬虫之路(7)--requests库的使用以及三种参数
在爬虫业务中确定需要的参数和发送请求方式也是极为重要的一部分。本文就讲解了requests库的使用以及三种请求参数,根据具体的需求,您可以选择合适的参数类型来发送请求。
2024-06-02 21:03:48 2547 1
原创 Python爬虫之路(6)--x京新发地获取菜价波动(Post请求)
以现在更多的网站选择前后端分离,数据不在直接加载到页面当中。本文讲解了动态数据应该如何去分析所在的位置以及如何发起请求拿到数据。
2024-06-02 21:02:46 1123
原创 Python爬虫之路(5)--入门示例-百度首页(Get请求)
爬虫入门示例--百度首页(Get请求)本文章主要讲解了一个最简单的爬虫案例,通过这个案例,带着大家了解一下爬虫,理解爬虫是做什么事情的。同时也会补充一些知识点,帮助大家入门爬虫。
2024-06-02 21:01:46 1719
原创 Python爬虫之路(4)--常见的前端标签
常见的前端标签认识 前端(页面展示)最基础的三件套HTML,CSS,JavaScript鼓励大家去了解学习一下,此处只讲解可能遇到的最常见的标签。
2024-06-02 21:00:12 802
原创 Python爬虫之路(3)--抓包工具介绍
抓包是网络爬虫开发中不可或缺的一环。通过使用Chrome开发者工具、Charles、Fiddler等工具,我们可以有效地分析和理解客户端与服务器之间的通信过程。提高开发效率和质量。
2024-06-02 20:58:59 1479
原创 Python爬虫之路(2)--常用术语以及开发流程
学习爬虫的前置知识 一、前言 在学习爬虫之前,需要我们了解一些前置的知识,包括常用术语,开发流程,抓包工具,前端标签等。
2024-06-02 20:57:12 1036
原创 Python爬虫之路(1)--为什么学习爬虫
爬虫是什么?爬虫能做什么?本文章将向大家介绍网络爬虫的相关内容。有任何问题欢迎大家的评论和指正。再次声明,本专栏只做技术探讨,严谨商用,恶意攻击等。
2024-06-02 20:55:48 1584
原创 Docker快速部署(go的web项目为例)
本文讲述如何利用docker在linux云服务器上快速部署go的web项目。只说需要用到的一些docker命令,同时会给出命令相关参数的讲解。
2024-04-28 15:13:45 1371 2
原创 python虚拟环境的实现
在日常python开发中,将开发环境隔离开是十分必要的。这篇文章讲解了如何简单的实现python的环境隔离(虚拟环境的创建)
2024-03-29 20:43:45 831 1
原创 Git可视化工具TortoiseGit的使用
这点是以gitee(国内版GitHub)作为示范,GitHub相似如有错误,欢迎指正需要下载:git,TortoiseGit(TortoiseGit相应汉化请自行操作,本文档会给出相应的英文单词)1.拉取代码git pull2.提交修改,git commit’记录提交的信息’,git push3.解决冲突(相同文件中,本地与线上的不同,需要解决)4.切换分支/创建分支switch/checkout5.合并分支6.查看那些人更改过文件。
2023-09-02 14:18:07 389
原创 【c语言期末大作业】加强剪切板cDitto的实现
最终,在机缘巧合之下,在某次当CV工程师的时候(ctrl+c复制 ctrl+v粘贴),无意间按到了win+v,打开了一个从来没有见过的界面,但是当我研究了一番后,我发现它居然记录了我开机以来,所有复制粘贴的内容,这对于(一个CV工程师(bushi))经常使用电脑的用户来讲,是一个新天地,它可以高效运用剪切板,再也不用多个界面切换复制粘贴(代码了),于是cditto出现知识点:一维数组,字符串,结构体,链表,文件操作,获取系统时间,调用第三方函数使用cmd命令,系统命令,类与方法,数据库,Qt可视化处理
2023-05-18 20:54:41 545
原创 约瑟夫问题-关于一圈人排序,依次报数出局的问题(运用环形链表解决)
经典约瑟夫问题,有13个人围成一圈依次报号,报号数为3时的人出局,从1开始重新报号,直到剩下一个人时,游戏结束。
2023-04-25 20:31:44 447
原创 有关利用PicGo搭建图床,上传图片失败的解决方法
因为要使用图床,利用到了阿里云以及PicGo来搭建,但在上传问题途中,出现了无法上传成功的问题,本人浏览了大部分关于上传失败的问题,任然无法解决,但在巧合下,发现了解决办法。
2023-03-27 18:35:45 1425
原创 【Python】学生管理系统GUI可视化版本
利用python中的tkinter库,实现了学生管理系统的可视化窗口,非GUI版本也可以参考其中的功能方法或函数,实现相应功能
2023-03-25 15:24:51 4946 2
原创 python爬取B站视频
苦于哔站网页版以及客户端版本都没有将视频完整下载到本地的情况,因此诞生了该篇文章,讲解如何利用python去实现视频下载到本地
2023-03-20 09:43:28 6871
原创 【C语言】各类指针的理解(小白学习笔记)
而对数组指针来说,首先它是一个指针,它指向一个数组,也就是说它是指向数组的指针,在 32 位系统下永远占 4 字节,至于它指向的数组占多少字节,这个不能够确定,要看具体情况。但依旧是错误的,在该赋值语句中,系统会在常量区一块新的空间写入字符串"orange"并返回其首地址,此时str由指向字符串常量"apple"的首地址变为指向字符串常量"orange"的首地址,str指向的地址发生了变化,但str是指针常量不能被修改,所以错误。在常量指针中,指针指向的内容是不可改变的,指针看起来好像指向了一个常量。
2023-03-20 09:40:24 403
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人