千万级数据的分类搜索引擎(一)

     这套分类搜索引擎花了我2年的时间,经历过好几次的版本升级,终于完成了分布式的版本,实际运营接近一年,相当稳定,系统最高容量达到1300W数据,单机支撑800W左右的商品,单机吞吐超过30个/秒,系统可平行扩展,本周就扩容了一次。下面逐步说明这套系统的架构。

一、搜索引擎的整体架构

 系统包含以下部分:

(1)轻量级WebServer:自己写的一个WebServer,高性能,大并发,自带WebCache模块,和一个单独的业务进程通过消息队列通信

(2)通用服务器:一个高性能的中转服务器,使用epoll模型,前端和WebServe用短tcp连接通信,后端和搜索引擎服务器用TCP长连接通信,自己管理一个连接池,双击热备

(3)分类搜索引擎:采用分布式架构,每个集群负责处理部分数据的浏览请求,集群之间互相备份,共同分担查询请求

(4)数据库服务器:作为一个流水DB,只记录商品的更新,删除操作,在搜索引擎取完数据后,即清空数据库表。

下一篇文章就逐一介绍这些模块。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值