天真作少年-CSDN博客

原创 Edge浏览器无法安全下载解决办法

4月最新Edge浏览器更新后，企业内部网站下载文件均会弹出”无法安全下载 xxxxxxx“，关闭浏览器设置里的Microsoft Defender Smartscreen无法解决此问题。

2024-04-25 16:32:10 1196

转载 web scraper中Selectors解析

2020-04-14 19:33:26 1972

原创 web scraper爬虫工具（简介）

web scraper 简介什么是web scraperweb scraper是一款网站数据提取工具，类似于爬虫，但不需要像python爬虫那样编写代码，使用门槛较低，适用于轻度的数据爬取。web scraper主要以谷歌扩展插件的形式存在，开发者介绍的Cloud Scraper暂时没了解过。以下是开发者给出的工具简介Web site data extraction toolSta...

2020-04-06 14:10:12 10241

原创 AD域基础

文章目录AD域基础1.什么是AD域2.AD域和工作组的区别2.1 工作组特点及优缺点2.2 AD域特点及优缺点3.为什么要做AD域管理4.AD域可以做什么AD域基础1.什么是AD域active directory 活动目录，指一组服务器和工作站的集合，域中的目录是始终呈激活可用，动态更新的状态域将计算机、用户的账号密码集中放在一个数据库内，使得用户只使用一个账号和密码就能够访问网络中的...

2019-06-30 15:23:59 5586

原创 python爬虫——代理、cookie、requests库

目录ProxyHandler处理器CookieProxyHandler处理器很多网站会检测某一段时间某个IP的访问次数(通过流量统计，系统日志等)，如果访问次数多的不像正常人，它会禁止这个IP的访问。所以我们可以设置一些代理服务器，每隔一段时间换一个代理，就算IP被禁止，依然可以换个IP继续爬取。 urllib中通过ProxyHandler来设置使用代理服务...

2018-08-03 22:03:12 483

原创 python爬虫——urllib库

目录urllib库urllib库urllib库是Python中一个最基本的网络请求库。可以模拟浏览器的行为，向指定的服务器发送一个请求，并可以保存服务器返回的数据。...

2018-08-02 11:49:00 291

原创 python爬虫——爬虫简介及http协议相关

什么是网络爬虫：1.通俗理解：爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并数据抓取下来，然后使用一定的规则提取有价值的数据。 2.专业介绍：百度百科通用爬虫和聚焦爬虫：1.通用爬虫：通用爬虫是搜索引擎抓取系统（百度、谷歌、搜狗等）的重要组成部分。主要是将互联网上的网页下载到本地，形成一个互联网内容的镜像备份。 2.聚焦爬虫：是面向特定需求的一种网络爬虫程序，他与通...

2018-08-01 09:47:39 457