爬虫
文章平均质量分 59
python爬虫教程
天玑y
向来不爱说废话
展开
-
爬取西游记章节名
【代码】爬取西游记章节名。原创 2023-12-21 23:20:06 · 390 阅读 · 5 评论 -
爬取大学排名
【代码】爬取大学排名。原创 2023-12-21 23:16:35 · 498 阅读 · 4 评论 -
爬虫:报错418
通过设置User-Agent头部信息为一个常见的浏览器User-Agent,如上述的Mozilla/5.0,你让请求看起来像是来自一个普通的浏览器,而不是爬虫。当你在进行网络爬虫时,有些网站会根据请求的User-Agent头部信息来判断是否是一个合法的请求。100 Continue:服务器已接收到请求的初始部分,并且客户端应继续发送其余部分。400 Bad Request:服务器无法理解客户端的请求,可能是语法错误等。201 Created:请求已经被实现,并且在服务器上创建了一个新的资源。原创 2023-12-06 00:31:14 · 1874 阅读 · 1 评论 -
网站爬取的数据整理(python 的 dict
我们将第一张表作为主要表格,将其余两个表格拼接到第一张表格上(即对于第一个表格中没有但其余表格中有的县,不予以拼接(这里用try except处理))数据类型为json格式,当然json格式对应于python就是列表+字典,所以可以掌握的列表和字典即可轻松读取json格式的数据。2.我们统计1990年到2020年医生增加的数量,所以用2020年减去1990年得到要统计的数据。1.由于县的医院有很多,所以bed进行累加处理。原创 2023-11-21 19:23:36 · 189 阅读 · 0 评论 -
爬虫&搜索引擎&浏览器
爬虫、搜索引擎和浏览器的区别原创 2023-11-20 23:39:41 · 1137 阅读 · 1 评论