垂直搜索设计思路系列: 垂直搜索引擎——路在何方(作者佚名,请指出)

      我曾经分析过垂直搜索引擎(veticalsearch)和网页搜索(websearch)的不同之处,介绍了招聘、生活、B2B等几个领域的垂直搜索引擎。在即将过去的2006年,垂直搜索可以说吸引了很多无论是用户还是投资商的眼球。我本身做为一个开发垂直搜索引擎的技术人员,从自己运营垂直搜索的一些感受,想说说到底各种垂直搜索该走向何处,如何走!
  现在的垂直搜索市场可以说是鱼目混杂,各个搜索提供商的服务、技术等等是良莠不齐,当然这也印证了一点,垂直搜索是大家关注的热点。垂直搜索的市场到底有多大,这个需要逐个领域分析,需要接触专业的市场调查机构的数据。但很明确的一点是,目前垂直搜索的市场还远小于网页搜索,被用户的认知程度也远不及网页搜索,随之而来的就是靠广告盈利的阻力也是非常之大。但这些并不能阻碍垂直搜索作为一个新兴互联网产业的“雄起”。下面的这些感想,可能比较零碎,我还没有来得及整理,希望能对各位同行或者对垂直搜索感兴趣的朋友有点作用。
  
  1.门户进入垂直搜索并不可怕,甚至造成不了多大的威胁。门户网站得以致胜的法宝是内容,现在很多门户也开始推出垂直搜索(爱问、yahoo),涉及到了B2B、购物、生活等领域,但是这些东西都不是其赖以生存的产品。搜索产品的本质是简单易用,而门户网站的特点又恰恰是大而全,即使提供了相关的服务,用户也是很难在复杂的页面中找到该服务,这就是为什么google、baidu能远远领先于门户的搜索引擎。同时,一个门户提供垂直搜索服务的时候,动辄就是近十多个产品,让人感觉没有一个是重点,典型的就是像yahoo、qihoo,若不是网站本身有流量,这样的搜索恐怕很难和一些专业的搜索服务商来竞争。再次,垂直搜索作为门户网站的一个附加服务,根本不影响到他的生存,因此,它也不会把所有的精力、人力、物力放在这么个鸡肋上,导致的就是服务质量低下。相反,作为专门提供垂直搜索的服务商,他们赖以生存之本就是这点搜索服务了,所以会拼尽全力去讨好用户,想方设法为他们提供最好的产品,其人性化要远远好于门户网站的产品。
  
  2.垂直搜索的技术储备是未来是否被市场淘汰的关键。现在的很多垂直搜索根本没有技术储备,零时拼凑一下开源的代码,就推出号称最好的XX搜索引擎。更有胜者,任何搜索都没做过,拿过来数据库就上,数据量小的时候没什么,数据量大了,自然就是关门大吉。至于搜索的质量,根本就是无稽之谈!能沉下心,打好技术基础的垂直搜索没有几个,这也是我们国内互联网的一个特点:急功近利,只知道炒作!
  
  3.产品设计至关重要。就是说一个好的创业团队是技术和产品的二者结合。同样的技术,不同的产品人员包装的效果就不一样,这个是我们中国创业者的特长。
  
  4.找到更有效的盈利方式,就说传统的广告连接、付费排名,做好了不是那么简单。能否从业务本身、从个人用户收费等角度想想,可能更能开拓思路!
  
  5.不要在搜索结果中耍流氓行为,不要和下游网站玩猫捉老鼠的游戏。这是大家很关注的问题,垂直搜索网站是不是会随着自己的壮大走上发布之路?可能每人都有各自的小算盘,就我个人而言,我觉得,我们做搜索就努力把搜索引擎的做大、做好。不要做那种爬别人的东西还作为自己的内容来用的盗窃勾当。垂直搜索一定是和下游内容提供网站共存亡、共赢得模式。千万不要妄自菲薄,除非自己对搜索没有信心,对自己的技术心虚!
  由于时间的原因,就暂时写这么多,希望各位朋友能补充进来更多的意见和建议,大家一起努力让垂直搜索光芒四射!
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SOPI垂直搜索引擎2.0是一个从信息采集到分析到索引的整套解决方案,让你也可以轻松拥有一个多功能垂直搜索引擎。可以针用于行业垂直信息进行搜索,网站搜索等各类应用。 SOPI垂直搜索引擎系统的应用特点 外网搜索引擎:众多内容型网站为了保持数据的最新,不得不花费大量的人力进行内容更新。 SOPI 系统可以锁定需要的网站,进行定时采集此网站的最新内容;可以节省大量的人力成本,而且可以保证信息的全面性,同时结合搜索技术在海量的信息库中快速找到需要的信息。 高应用扩展性,可以根据用户需求快速配置成为不同类型的垂直搜索引擎,如成为商机搜索产品信息及其他各类需要的信息。只需普通技术人员便可以实现。 极少量的人工干预,系统管理员仅通过管理界面即可自动实现各类信息的搜索。大部分工作由系统自动完成。 自动生成对网站的配置,提高工作效率及降低工作难度,垂直搜索引擎对不同网站进行不同配置是必然的,本系统应用自动化技术将人工工作降到最低,将工作人员的技术要求降至最低。 可以从多个界而采集信息,系统进行自动合并,如从一个页面搜索产品信息,另一个网页搜索公司信息,将两个页面的内容自动合并。 站内搜索引擎:可以轻松将内部网站的内容进行索引,为企业提供企业知识管理,或为网站用户提供自身网站的搜索服务。 SOPI 搜索系统采用先进的索引机制,高效对全文进行索引及搜索,可以产生与百度和 GOOGLE 相同的准确结果,而且快速; SOPI搜索引擎系统的技术特点 使用与GOOGLE相同的数据库系统Oralce Berkeley DB嵌入式数据库,千万级数据状况下操作数据仍保持在毫秒级,与使用ORACLE或SqlServer数据库性能提升数百倍。 系统结构的合理分离有利于分布式架构,适应未来大量的搜索工作,可以轻易在多服务器环境中进行应用。 各子系统相互独立,任一子系统的停止运行不影响其他系统,有效保证稳定性; 先进的文章及图片指纹技术,超低重复率。由于不同网站有大量重复信息,如果不能有效辨别文章是否存在将会有大量重复信息存在,图片一样会有大量重复存在。 SOPI 系统采用先进的文章和图片识别系统有效保障超低重复率; 对文章和图片的超强提取能力,系统可以在各种复杂的网页中提取标题正文和时间等参数,可以高智能的提取有用的信息,过虑无用信息; 高性能的分词组件,字典词库高质量,保证索引和搜索的准确性; 优秀的管理平台,可以方便管理进行信息采集的站点列表,及对下载的层级进行自定义; 可便捷对系统进行扩展,以满足不同的需求 SOPI垂直搜索引擎子系统 SpiderService 作用:通过此服务将需要搜索的网站中的信息下载到本地 存储关系:通过从存储系统中读取下载列表,将下载的信息保存至硬盘 运行方式:以WINDOW服务方式自动运行 人工干预度:不需干预 AnalyseService 作用:此服务将下载到本的信息进行分析,为SpiderService提供新的URL列表,同时根据配置对网页中的内容进行提取,如供求信息\\文章\\产品信息等 存储关系:将分析结果及新URL保存到数据库 运行方式:以WINDOW服务方式自动运行 人工干预度:不需干预 AutoMatchService 作用:此服务用来自动匹配字段信息,如根据网站中分析的地区信息\\行业分析信息等各类分类信息匹配成为系统需要的信息,如从网站获得的地区信息:浙江省>>杭州市>>将这一内容自动匹配为浙江省或杭州市,也可以根据企业名自动匹配地区信息,如:杭州市欧派信息技术有限公司匹配为杭州市 存储关系:根据数据库中的存储结果自动匹配为需要形式的结果 运行方式:以WINDOW服务方式自动运行 人工干预度:不需干预 IndexService 作用:此服务用来将完善的信息索引到索引库,提供外部进行搜索,通过索引库的建立可以向用户提供如类似BAIDU一样的搜索 存储关系: 运行方式:以WINDOW服务方式自动运行 人工干预度:不需干预 TokenizerService 作用:此服务用来向WEB提供分词服务,向用户BAIDU式搜索提供支持 存储关系:从数据库读取信息,转换成索引库中的内容 运行方式:以WINDOW服务方式自动运行 人工干预度:不需干预 管理WEB 作用:通过管理WEB可以实现需要的搜索及自定义的结果 存储关系:操作数据库及配置库 运行方式:WEB形式运行 人工干预度:人工干预 用户WEB 作用:向用户提供信息服务 存储关系

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值