爬虫
Casionx
爱家人 爱自己 爱生活 爱coding
展开
-
网络爬虫基本原理
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。 网络爬虫是捜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网上的网页下载到本地形成一个或联网内容的镜像备份。这篇博客主要对爬虫以及抓取系统进行一个简单的概述。[一、网络爬虫的基本...转载 2016-05-16 08:50:51 · 5722 阅读 · 0 评论 -
phpquery中文手册
【简介】phpQuery是一个基于PHP的服务端开源项目,它可以让PHP开发人员轻松处理DOM文档内容。更有意思的是,它采用了jQuery的思想,使得可以像使用jQuery一样处理页面内容,获取想要的页面信息。【步骤】1.引入phpquery类库 下载连接点击下载include 'phpQuery/phpQuery.php'; 2加载需要获取内容的网页连接或则文档...原创 2017-11-30 22:13:03 · 21012 阅读 · 0 评论
分享