Python爬虫技术与应用
文章平均质量分 95
爬虫最新技术
andyyah晓波
这个作者很懒,什么都没留下…
展开
-
Python爬虫技术与应用:原生态网络爬虫开发
cookie可以翻译为“曲奇、小饼干”,cookie在网络系统中几乎无处不在,当浏览以前访问过的网站时,网页中可能会出现“你好XXX”,这会让人感觉很亲切,就如同吃了一个小甜品一样。这其实是经由访问主机中的一个文件来实现的,这个文件便是cookie。在因特网中,cookie实际上是指少量信息,是由Web服务器创建的,把信息存储在用户计算机上的文件。一般网络用户习惯用其复数形式cookies,指某些网站为甄别用户身份、进行会话跟踪而存储在用户本地终端上的数据,而这些数据通常会经由加密处理。原创 2024-08-14 21:09:58 · 1463 阅读 · 0 评论 -
Python爬虫技术与应用:Python基本知识介绍
1.HTML解释(1)HTML是指超文本标记语言(Hyper Text Markup Language)。(2)HTML不是一种编程语言,而是一种标记语言(Markup Language)。(3)标记语言是一套标记标签(Markup Tag)。(4)HTML使用标记标签来描述网页。2.HTML标签(1)HTML标签是由尖括号包围的关键词,如。(2)HTML标签通常是成对出现的,如和。(3)标签对中的第一个标签是开始标签,第二个标签是结束标签。(4)开始标签和结束标签也被称为开放标签和闭合标签。原创 2024-08-14 08:17:36 · 1429 阅读 · 0 评论 -
Python爬虫技术与应用:网络爬虫概述
网络爬虫的不同抓取策略,便是利用不同的方法确定待抓取URL队列中URL的优先顺序。网络爬虫的抓取策略有很多种,但不管方法如何,其根本目标一致。网页的重要性评判标准不同,大部分采用网页的流行性进行定义。网页结构分布图如图1-5所示。原创 2024-08-13 19:01:32 · 1675 阅读 · 0 评论