爬虫基础
文章平均质量分 78
蓝花楹下
这个作者很懒,什么都没留下…
展开
-
第二章 爬虫-网页请求原理(习题)
爬虫-网页请求原理(习题)原创 2023-05-22 20:27:22 · 2725 阅读 · 5 评论 -
第二章 爬虫(网页请求原理)
爬虫请求网页相当于用户使用浏览器加载网页的过程, 这个过程主要就是浏览器发请求,服务器响应,因此了解浏览器和服务器是怎么交互的是很重要的,所以这章主要是网页请求相关知识原创 2023-05-17 18:27:38 · 479 阅读 · 0 评论 -
第一章 认识网络爬虫(习题)
16.先把种子url放入待抓取url列表,依次从该列表中读取url并用DNS解析,把解析好的服务器ip和网页地址给网页下载器,下载器从互联网下载资源到本地,在将本地的资源放入下载页面库中,同时把下载过的url放入已抓取url队列,再从下载的网页中抽取url,看是否已经在已抓取url队列,如果不在就放入待抓取url队列,循环爬.直到待抓取url为空。3.网络爬虫按照系统结构和实现技术可分为通用网络爬虫,______,增量式网络爬虫,深层网络爬虫.13.下列选项中,表示robots协议禁止网络爬虫访问的是()原创 2023-05-16 19:22:10 · 4583 阅读 · 1 评论 -
第一章 爬虫(认识网络爬虫)
爬虫笔记(不断更新)原创 2023-05-16 12:24:12 · 1046 阅读 · 0 评论