搜索引擎(综合)向左 垂直搜索引擎向右

2009716,中国互联网络信息中心(CNNIC)发布《第24次中国互联网络发展状况统计报告》显示,截至2009630日,我国网民规模、宽带网民数、国家顶级域名注册量(1296万)三项指标仍然稳居世界第一,互联网普及率稳步提升。 另据统计,随着3G业务的开展,使用手机上网的网民半年内增长了32.1%,已达到1.55亿,占网民的46%

网民基数的增长带动“搜索一族”的快速飙升,网民对搜索服务的需求也发生较大的变化,相较于百度、谷歌的多而广的搜索结果,他们则对“搜索引擎”所呈现的精准搜索结果以及相关黏性服务更感兴趣。

有需求就会催生新的市场需求,“垂直搜索引擎”的概念逐渐成熟,并被不少具有创新力和执行力的企业成功引入商业运营,如房产类垂直搜索的搜房网,综合类垂直搜索的酷讯网,以及大学生求职垂直搜索类的宾果求职网……

 

一、             什么叫做搜索引擎(综合)?

1.【概念】

搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。

    从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。

  互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。

 

2.【工作原理】

1)抓取网页

  每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。

  

2)处理网页

  搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。

  

3)提供检索服务

用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

 

3. 【搜索引擎组成】

 

  搜索引擎一般由搜索器、索引器、检索器和用户接口四个部分组成:

  搜索器:其功能是在互联网中漫游,发现和搜集信息;

  索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;

  检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;

用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项

 

4.【搜索引擎的分类】

  

网页 音乐(翻唱 MP3)影视(电影 电视) 视频 播客 软件 BT下载 硬件 图片 壁纸相册 小说 文学 文档(论文 述职报告 思想汇报 演讲稿 入党申请书 作文 个人简历 毕业论文 法律论文 经济论文 教育论文 会计论文 计算机论文 毕业论文集情书 调查报告 求职信 商业计划书 实习报告 就职演说 自荐信 企划方案 企业管理 年终总结) 新闻(资讯) 百科(知识 经验) 教育 人物 学校 专业 论坛社区 博客 词典 翻译 地图 动漫 Flash 游戏 娱乐 笑话 汽车 家电 手机 广告 购物 商业 黄页 房产招聘 财经 股票 基金 法律 国学 图书 政府 目录 学术 代码 公交 实用查询等几十个分类。

 

5.【搜索引擎作用】

 

  搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的一个有效工具”。高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售。

  而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。

  1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用;

  2、从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销;

3、就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。

 

6.搜索引擎对网站的影响

一个网站的命脉就是流量,而网站的流量可以分为两类。一类是自然流量,一类就是通过搜索引擎而来的流量。如果搜索引擎能够能多能有效的抓取网站内容,那么对于网站的好处是不言而喻的。所以,SEO也应运而生了。

  在两大搜索引擎的工作中,百度的工作周期相对来说比Google短一些,百度大约在10天左右重新访问网站一次,Google大约在15天左右重新访问一次网站。由于一天之内不能游历全球所有的网站,如果推广网站时,能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节

 

7.分地区的搜索引擎市场份额

 

京沪穗

东部沿海市

中部省会城市

西部中心城市

总体

百度

60.9%

67.9%

72.2%

68.3%

65.8%

谷歌/Google

27.0%

21.3%

16.1%

16.1%

22.0%

搜狗

3.1%

2.3%

2.3%

3.4%

2.9%

雅虎

2.4%

1.6%

1.5%

4.2%

2.3%

其他

6.6%

6.9%

7.9%

8.0%

7.0%

合计

100.0%

100.0%

100.0%

100.0%

100.0%

 

(此数据引自:北京正望咨询)

8 各类学生用户占比

 (此数据引自:北京正望咨询)

 

 

    尽管百度与谷歌占有搜索引擎市场的大部分份额,但结合中国搜索引擎市场仍处于发展阶段的现状来看,后来者仍然拥有不少的机会,尤其是垂直化、细分化的搜索引擎由于更贴近用户体验而迅速成为2009年被关注的焦点。遍观各个产业领域,我们都可以发现一个个正在迅速成长的垂直搜索引擎。

有道、SOSO、搜狗以及近期微软必应的崛起,使中国综合搜索引擎市场本就弥漫着的硝烟更显浓烈,究竟是两巨头称霸还是众人划“行”而治,诸多搜索引擎厂家正进行着无休止的财力与创意的博弈。但值得肯定的是,多年来执着在垂直细分领域的搜索引擎厂商已经看到了市场的第一缕阳光,他们充满信心地期待着朝阳喷薄而出的时刻。

 

 

二、        什么是垂直搜索引擎?

 

    垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

   垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。

 

1.垂直搜索引擎框架

  垂直搜索引擎通常由三大部分组成:抓取系统,索引系统和搜索系统。  

1)抓取系统,也就是蜘蛛程序,负责从信息源抓取数据,蜘蛛程序通常是基于预先构造的模板工作的,无模板的蜘蛛程序只能处理结构相对简单的信息,抓取系统涉及的关键技术点有爬行路径分析、增量抓取与全抓取、信息构造完整性、信息唯一性识别、多网页信息整合、自动标引(此功能也可以单独提出)等;

 

2)索引系统,把抓来的信息建立类似书目的数据文件,以便于实现高速检索。索引系统涉及的关键技术点有分词技术、预评分和后评分、增量索引与全索引、排序技术、热点词高速缓存、标准检索语句解析等;

 

3)搜索系统,就是提供搜索功能的网站,网站的具体表现形式大不相同,但是都提供全文搜索功能,除了搜索功能外,还提供与业务相关的其他功能,譬如按地域导航检索、会员注册、订阅等。很多人把GOOGLE、百度称之为站外搜索,而把其他基于数据库的搜索称之为站内搜索,其实所有的搜索引擎提供的都是站内搜索,数据都是预先存储在本地的。

 

2.垂直搜索引擎的本质 

垂直搜索的本质是对垂直门户信息提供方式的一次简化性的整合,就是用户无法描述道他要找什么,除非让他看到想找的东西,这个过程有点像找“对象”,碰运气是用户搜索行为的最大的特征。而垂直搜索引擎就是为用户提供更好的运气。

 

3.垂直搜索的内容来源

 

  A门户网站自身的资源

  B以开放接口方式让行业用户提供的资源

  C普通用户发布的资源

D抓取行业用户的资源

 

4.进入垂直搜索的门槛在那里?

  在互联网上说门槛,就是比资源。垂直搜索也是这样,能否提供全面权威的行业信息,能否拥有行业资源是垂直搜索引擎发展的门槛。换句话说,垂直门户是垂直搜索血统最近的父亲。作为房产行业的“搜房网”就是一个垂直门户,在房产领域没有谁比它们更清楚什么是垂直搜索了。

垂直搜索的难点不是技术,而是用户参与门户网站行为的创新和垂直门户网站对产业上下游信息资源的整合。

 

 

5.垂直搜索引擎的三个特点:

  

1)垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点:

  比如:宾果求职网(www.bingojob.cn)的数据来源:前程无忧、智联招聘、中华英才以及各高校的就业信息网 等;

  

2)垂直搜索引擎抓取的数据倾向于结构化数据和元数据:

  比如:我们找工作关注的:

  职位信息: 软件工程师;

  公司名称,行业名称:软件公司,外包行业等;

  地点:北京,海淀;

  

3)垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索:

比如: 找:海淀 软件工程师 的工作等。

 

6.垂直搜索引擎的目标

 

在做垂直搜索引擎的时候你需要考虑:什么问题是这个行业内的特殊性问题,什么问题是一般性问题。Google的目标是,让用户尽快离开Google,而垂直搜索引擎应该粘住用户。一般来说,使用垂直搜索引擎的用户都是和用户的利益需求密切相关的。所谓利益需求是是和用户工作紧密相关,生活中必不可少的需求,而且有持续性。比如:学生找工作,业主找房源信息等等这样的需求。因此粘住用户,让用户有反馈的途径是一个关键部分。

 

 “确解用户之意,切返用户之需”这是垂直搜索引擎最终目的,技术只是手段,目的是切反用户之需,垂直搜索引擎的其出现的本身就是为用户提供较搜索引擎(综合)更精准的服务,其最本质的东西就是培养用户的使用习惯和技巧,而不是刻意干扰用户的意图,主要是培养用户的使用习惯和技巧,因为有些需求,用户本身可能也不是太清楚……在这方面做的比较好的有房产类搜索引擎搜房网(提供的服务包括, 新房、二手房、租房、写字楼/商铺、家居、资讯等六个大类的搜索服务);大学生职位垂直搜索引擎宾果求职网(提供的服务包括:职位搜索、资讯搜索、专业向导、招聘会/宣讲会、宾问果答、职业测评等涵盖毕业生求职的系列服务)……

 

    而且“用户无法描述他要找什么,除非让他看到想找的东西。” 一切都需要摸索,尝试,问题需要一个一个解决,用户的需求也需要得一点点的挖掘。

 

搜索引擎是一个产品,给用户提供服务的产品,需要长期的不断的改进升级调整才能持续不断的提用户体验,需要满足用户不断增长并且变化的需求、需要不断适应网络的变化。这是因为网络环境是不断变化的、网民的需求也是不断变化的。千万不要把搜索当成项目来做。在搜索引擎领域是讲体验的、新的引擎如果用户体验一旦整体上有领先一年以上的差距并且持续2年,那前期的领先者的优势就荡然无存,因为搜索引擎的用户转移成本相对而言是比较低的而且口碑是最佳的传播方式。如果一个搜索引擎不能持续不断的技术创新理念创新,那对于这个搜索引擎来说就等于死亡。我们一般形容搜索引擎的领先是以时间计算的。

当垂直搜索引擎的出现,也预示着新的引擎革命的到来,“用户无法描述他要找什么,除非让他看到想找的东西”,而这个问题也正在随着不同形式的“垂直搜索引擎”的出现得以化解……

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值