Python爬虫
网页数据抓取
公子翎_Lynne
这个作者很懒,什么都没留下…
展开
-
Python爬虫 | 简介
什么是爬虫 爬虫就是通过编写程序模拟浏览器上网,然后去互联网上爬取/获取数据的过程。 爬虫的分类 - 通用爬虫:就是爬取互联网中的一整张页面内容。 - 聚焦爬虫:根据指定的需求爬取页面中指定的局部内容 - 增量式爬虫:用来检测网站数据更新的情况。只会爬取网站中最新更新出来的数据。 反爬虫:门户网站通过相应的策略和技术手段,防止爬虫程序进行网站数据的爬取。 反反爬虫:爬虫程序通过相应...原创 2020-05-05 18:17:08 · 100 阅读 · 0 评论 -
http和https协议
一、HTTP协议 1.简介 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写, 是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。 HTTP协议就是服务器(Server)和客户端(Client)之间进行数据交互/传输数据的一种形式。我们可以将Server 和 Client进行拟人化,该协议就是 Server...原创 2020-05-05 18:14:08 · 747 阅读 · 0 评论