网络爬虫技术笔记
自己学习时记得笔记,希望大家一起来讨论哦
3sin2x
这个作者很懒,什么都没留下…
展开
-
Scrapy爬虫
1.爬取目标网址很多2.包含数据采集、解析、清晰、存储全流程3、方便后期运维管理(模块化、集成度高)原创 2023-05-23 20:42:02 · 319 阅读 · 1 评论 -
网络爬虫技术笔记——常规动态网页爬取
1.无法从HTML源码中直接获取页面元素2.前端页面与后台数据库联动,动态更新3.网页内容可能由JavaScript动态生成4.可能应用了AJAX技术和动态HTML技术。原创 2023-05-20 11:48:13 · 919 阅读 · 0 评论 -
网络爬虫技术笔记——静态网页爬取
含义:纯粹HTML格式,没有后台数据库、不含程序、不可交互查看方式:鼠标右键+查看网页源代码。原创 2023-05-18 17:07:21 · 809 阅读 · 1 评论