Fly_鹏程万里

专注于IT技术,只做IT技术的分享与研究,欢迎广大IT技术人员参与分享与讨论!...

排序:
默认
按更新时间
按访问量
RSS订阅

Python网络爬虫——-2.网络爬虫基本原理

网络爬虫是捜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网上的网页下载到本地形成一个或联网内容的镜像备份。这篇博客主要对爬虫以及抓取系统进行一个简单的概述。一、网络爬虫的基本结构及工作流程    一个通用的网络爬虫的框架如图所示:    网络爬虫的基本工作流程如下:    1.首先选取一部...

2018-04-01 17:30:56

阅读数 114

评论数 0

Python网络爬虫——1、网络爬虫简介

什么是网络爬虫网络爬虫(又称为网页蜘蛛、网络机器人,在FOAF社区中间,更经常被称为网页追逐者),是一种按照一定规则,自动的抓取万维网信息的程序或者脚本,已被广泛应用于互联网领域。搜索引擎使用网络爬虫抓取WEB网页、文档甚至图片、音频、视频等资源,通过相应的索引技术组织这些信息,提供给搜索用户进行...

2018-04-01 17:30:43

阅读数 248

评论数 0

提示
确定要删除当前文章?
取消 删除