继续回答星球水友提问。
==
沈哥,我们有个业务,类似于“标题分词检索”,并发量非常大,大概20W次每秒,数据量不是很大,大概500W级别,而且数据不会频繁更新,平均每天更新一次,请问有什么好的方案么?
==
这是一个典型的,短文本分词搜索的问题,简单聊聊自己的经验。
常见的文本检索方案有哪些?
(1)数据库LIKE法
将标题数据存放在数据库中,使用like来查询,方案非常简单,能支持简单的模糊搜索,但不支持分词。
画外音:显然不适用于本例。
(2)数据库全文检索法
将标题数据存放在数据库中,建立全文索引来检索,方然依然简单,利用了数据库的能力,不用额外开发,但性能较低。
画外音:本例的并发肯定扛不住。
(3)开源方案索引外置法
搭建lucene,solr,ES等开源搜索工具,建立索引,支持分词,支持数据量和吞吐量的水平扩展。
该方案能够很好的满足本例的需求。但是,杀鸡焉用牛刀ÿ