- 博客(8)
- 收藏
- 关注
原创 Edge浏览器无法安全下载解决办法
4月最新Edge浏览器更新后,企业内部网站下载文件均会弹出”无法安全下载 xxxxxxx“,关闭浏览器设置里的Microsoft Defender Smartscreen无法解决此问题。
2024-04-25 16:32:10
1196
转载 web scraper中Selectors解析
web scraper中Selectors解析版权声明:本文为CSDN博主「书上猴爵」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/qq_36931982/article/details/91414349Text:文本选择器用于文本选择。文本选择器将从所选元素(element)中提取文本数...
2020-04-14 19:33:26
1972
原创 web scraper爬虫工具(简介)
web scraper 简介什么是web scraperweb scraper是一款网站数据提取工具,类似于爬虫,但不需要像python爬虫那样编写代码,使用门槛较低,适用于轻度的数据爬取。web scraper主要以谷歌扩展插件的形式存在,开发者介绍的Cloud Scraper暂时没了解过。以下是开发者给出的工具简介Web site data extraction toolSta...
2020-04-06 14:10:12
10241
原创 AD域基础
文章目录AD域基础1.什么是AD域2.AD域和工作组的区别2.1 工作组特点及优缺点2.2 AD域特点及优缺点3.为什么要做AD域管理4.AD域可以做什么AD域基础1.什么是AD域active directory 活动目录,指一组服务器和工作站的集合,域中的目录是始终呈激活可用,动态更新的状态域将计算机、用户的账号密码集中放在一个数据库内,使得用户只使用一个账号和密码就能够访问网络中的...
2019-06-30 15:23:59
5586
原创 python爬虫——代理、cookie、requests库
目录ProxyHandler处理器CookieProxyHandler处理器很多网站会检测某一段时间某个IP的访问次数(通过流量统计,系统日志等),如果访问次数多的不像正常人,它会禁止这个IP的访问。所以我们可以设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,依然可以换个IP继续爬取。 urllib中通过ProxyHandler来设置使用代理服务...
2018-08-03 22:03:12
483
原创 python爬虫——urllib库
目录urllib库urllib库urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。...
2018-08-02 11:49:00
291
原创 python爬虫——爬虫简介及http协议相关
什么是网络爬虫:1.通俗理解:爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来,然后使用一定的规则提取有价值的数据。 2.专业介绍:百度百科通用爬虫和聚焦爬虫:1.通用爬虫:通用爬虫是搜索引擎抓取系统(百度、谷歌、搜狗等)的重要组成部分。主要是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 2.聚焦爬虫:是面向特定需求的一种网络爬虫程序,他与通...
2018-08-01 09:47:39
457
原创 JavaSE——类的基本构成及字节码
package mypackage; //定义包import java.util.List; //引入类public class HelloWorld { //定义类 ...
2018-05-10 12:37:00
208
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人