![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 93
current233
这个作者很懒,什么都没留下…
展开
-
python - 爬虫之urllib模块一览总表
urllib模块方法描述,urllib.request 方法(urllib.request.urlopen对象常见方法),urllib.parse方法原创 2023-04-29 12:03:23 · 102 阅读 · 0 评论 -
python - 爬虫之了解url网址概念和HTML基础
静态网页是标准的 HTML 文件,通过 GET 请求方法可以直接获取,文件的扩展名是.html、.htm等,网面中可以包含文本、图像、声音、FLASH 动画、客户端脚本和其他插件程序等。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。我们知道,当网站信息量较大的时,网页的生成速度会降低,由于静态网页的内容相对固定,且不需要连接后台数据库,因此响应速度非常快。在编写一个爬虫程序前,首先要明确待爬取的页面是静态的,还是动态的,只有确定了页面类型,才方便后续对网页进行分析和程序编写。原创 2023-04-29 11:55:21 · 1240 阅读 · 0 评论