Search Engine
Janlex2008
这个作者很懒,什么都没留下…
展开
-
搜索引擎决定链接价值的17个指标
<br /> 前面我们讲了关于网站链接(外链)建设策略及效果和影响外链价值的因素 ,下面是一篇来自seoMoz的关于搜索引擎如何评定链接价值 的文章。 <br /> 今天约见一个新客户,这个客户好奇地问我,搜索引擎是怎样给某个网页排名的,你推荐的这些SEO改动为什么会对排名的变动有影响,你在哪儿学的SEO,你能不能给列一下你做一些比较好的SEO案例?当你进的项目进行到一定深度时,就会开始进行链接建设 (外链建设)了。客户想知道为什么链接建设那么重要?你就拉出那张“影响网站排名的因素 ”给他看,转载 2010-08-28 17:47:00 · 144 阅读 · 0 评论 -
分布式网络爬虫关键技术分析与实现——分布式网络爬虫体系结构设计
<br />一、 研究所属范围分布式网络爬虫包含多个爬虫,每个爬虫需要完成的任务和单个的爬行器类似,它们从互联网上下载网页,并把网页保存在本地的磁盘,从中抽取URL并沿着这些URL的指向继续爬行。由于并行爬行器需要分割下载任务,可能爬虫会将自己抽取的URL发送给其他爬虫。这些爬虫可能分布在同一个局域网之中,或者分散在不同的地理位置。根据爬虫的分散程度不同,可以把分布式爬行器分成以下两大类:1、基于局域网分布式网络爬虫:这种分布式爬行器的所有爬虫在同一个局域网里运行,通过高速的网络连接相互通信。这些爬虫通过同原创 2011-01-20 20:12:00 · 812 阅读 · 0 评论 -
使用 HttpClient 和 HtmlParser 实现简易爬虫
这篇文章介绍了 HtmlParser 开源包和 HttpClient 开源包的使用,在此基础上实现了一个简易的网络爬虫 (Crawler),来说明如何使用 HtmlParser 根据需要处理 Internet 上的网页,以及如何使用 HttpClient 来简化 Get 和 Post 请求操作,构建强大的网络应用程序。 使用 HttpClient 和 HtmlParser 实现简易爬虫 这篇文章介绍了 HtmlParser 开源包和 HttpClient 开源包的使用,在此基础上实现了一个简易的网络爬虫 (原创 2011-01-20 20:49:00 · 288 阅读 · 0 评论