比较购物搜索之搜索引擎的设计——货比百家(huobibaiija.com)

   货比百家比较购物搜索5月17日已经上线了,没日没夜的忙了个好些时间。计划6月10号离开北京,先回趟家(一年多没回家了),然后去上海、杭州、义乌走走看看,用双腿读书,用眼睛思考。走之前的这段时间,整理下文档,blog下心得。

   先说下比较购物搜索,比较购物最初的设想,是为消费者提供从多种在线零售网站中进行商品价格、网站信誉、购物方便性等方面的比较资料,随着比较购物网站的发展,其作用不仅表现 在为在线消费者提供方便,也为在线销售上推广产品提供了机会,实际上也就等类似于一个搜索引擎的作用了,并且处于网上购物的需要,从比较购物网站获得的搜 索结果比通用搜索引擎获得的信息更加集中,信息也更全面,于是比较购物网站也就逐渐发展演变为购物搜索引擎。

   国内购物搜索引擎也蛮多的,比如迅购、智购、聪明点等等。迅购、智购采用的是返利模式的,聪明点是纯比较购物了。货比百家设想是社区型的比较购物网站,与微博啦、sns社区打通,不过现在才走出第一步,路漫漫其修远兮,上下求索。

   好了,说技术了。搜索引擎分为数据采集和搜索两部分,采集暂且不说了。

   搜索部分又分为两部分:索引和搜索。索引的设计,采用的是主、副本存储索引的机制,定时更新数据。主目录不参与搜索,数据的增删改都在主目录进行,一切ok了,生成新的副本,然后将搜索使用的目录切换到新的副本。这个机制保证了搜索的稳定性。09年在linkchina做搜索设计的这套机制,稳定性在项目中得到的佐证,这次在基础又重新做了改进。lucene有了commit();后,切换索引目录的方式可能不需要了,下次调整改进验证。

   搜索呢,除了lucene提供的基本功能外,还需要使用的就是分类搜索了:Faceted Search,货比百家的分类搜索采用的是bobo-browser,linkedin的开源项目,跑起来也蛮欢畅的。

   还有就是商品比较了,商品是归类整理好的,商品比较呢,商品名称 + 商品分类,即查找同一类的名称相似的商品。这个算法还期待改进。

   好像还少了点,对了,中文分词。中文分词用的是paoding,用了很久,蛮不错的。

   好了,信手涂鸦,未经编辑。有兴趣的朋友看看网站,提提建议,多多交流。

   网址: http://www.huobibaijia.com/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值