- 博客(4)
- 收藏
- 关注
原创 爬虫之数据显示 第四天(4)
pyechsrts库是一个可以多种形式显示数据的一个库在这里我们介绍一下这个库的几种图像的写法。下载模块指令 pip install pyecharts。本文章主要介绍的是pyecharts模块。第一种 折线图(Line)第三种 散点图(Scatter)第二种 柱状图(Bar)第四种 饼图(Pie)第五种 地图(Map)以上是五种常见的地图。如果有不懂的可以留言。
2024-08-22 22:55:51 155
原创 爬虫第三天(3)
因为find_all()函数返回我们的是以列表的形式返回所有我们分别用到for循环遍历一个遍然后配合着正则表达式把所有数据提取出来。请求完之后我们要用到bs4中的Beautfulsoup类来提取代码中的数据再用到bs4之前要下载lxml模块是用来解析代码的工具。在这里我们可以直接用find_all()函数找到<th>和<tr>标签因为是两个不同的标签所以要分为两个不同的部分来提取数据。老样子下载模块Beautfulsoup4这个模块有意思的就是名字这个模块的中文名字是美丽的汤为什么叫美丽的汤呢我也不晓得。
2024-08-21 22:12:00 734
原创 爬虫第二天(2)
在输入命令 pip install requests 回车shift键下载完成。然后用where python 找到python解释器的位置。然后使用cd 命令切换到python解释器目录下。首先本文章要用到的库requests,re。我们先要下载 requests 的第三方库。今天展示的是如何爬取网页中的多张图片。win + R 调出运行框输入cmd。以上代码仅供参考如果有不懂的可以留言。然后以二进制的方式保存到文件里面。用上一节的知识开始请求目标网站。1.确认要爬取的目标网站。首先还是爬虫的四个步骤。
2024-08-20 23:32:54 113
原创 学习爬虫的第一天
然后我们选择一张要爬取的包中的图片数据然后点击Headers(请求头)如果显示是GET那就是需要GET请求还有很多请求我们在这里就主要了解GET请求这里的200表是可以请求。然后点击开发者工具中左上角搜索就会在开发者的工具的左边弹出来一个搜索然后你就可以搜索要爬取的数据了。现在我们开始在python环境中写属于咱们的第一个爬虫也是最简单最基础的爬虫。这样我们就下载好了requests模块了接下来我们要最做的是爬虫的流程。再点击回车键之后显示的最左边的是在哪一个磁盘中。
2024-08-19 22:35:34 863
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人