爬虫学习
晶晶老公
这个作者很懒,什么都没留下…
展开
-
selenium的Keys模块
BACKSPACE(或者BACK_SPACE) ——退格、删除键TAB ——有时可用来切换input框的焦点ENTER ——回车键,有时可用来代替点击提交按钮SHIFT(或LEFT_SHIFT) ——和其他按键同时发送,可发送大写字母或特殊符号CONTROL(或LEFT_CONTROL) ——和其他按键同时发送可实现一些功能如‘CONTROL+A’、‘CONTROL+C’、‘CONTROL...转载 2019-04-11 20:01:53 · 1111 阅读 · 0 评论 -
爬虫认识
网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟客户端发送网络请求,获取请求响应数据,一种按照一定的规则,自动地抓取互联网信息的程序。只要是浏览器能做的事情,原则上,爬虫都能够做主要用途数据采集爬虫的更多用途(了解)12306抢票/各种抢购网站上的投票短信轰炸网络攻击Web漏洞扫描器爬虫的分类按照爬取范围分为两类通用爬虫又称全网爬虫(Scalable Web Crawl...转载 2019-04-03 19:09:50 · 317 阅读 · 0 评论 -
爬虫的工作流程
爬虫的工作流程(重点)总结: 搜索引擎流程 与 聚焦爬虫流程的区别:搜索引擎流程:爬取范围: 整个网络, 见到URL就爬保存的数据: 保存的是原始的HTML预处理: 主要是 分词, 排名聚焦爬虫流程爬取范围: 特定的URL, 只有有需要的数据的URL,才爬取保存的数据: 保存的是需要的数据....转载 2019-04-03 19:11:22 · 1432 阅读 · 0 评论