1.概述
概念:用户输入想要的关键词,返回含有该关键词的所有信息。
场景:
1
互联网搜索:谷歌、百度、各种新闻首页
2
站内搜索(垂直搜索):企业
OA
查询订单、人员、部门,电商网站内
部搜索商品(淘宝、京东)场景。
2.数据库搜索弊端
2.1.存储问题: 电商网站商品上亿条时,涉及到单表数据过大必须拆分表,
数据库磁盘占用过大必须分库(
mycat
)。
2.2.
性能问题:解决上面问题后,查询
“
笔记本电脑
”
等关键词时,上亿条数据
的商品名字段逐行扫描,性能跟不上。
2.3
不能分词如: 搜索
“
笔记本电脑
”
,只能搜索完全和关键词一样的数据,那
么数据量小时,搜索
“
笔记电脑
”
,
“
电脑
”
数据要不要给用户。
3.常见的所搜引擎
1 总结2 1 、 es 基本是开箱即用 ( 解压就可以用 !) 【南京】 , 非常简单。 Solr安装略微复杂一丢丢 !3 2 、 Solr 利用 Zookeeper 进行分布式管理 , 而Elasticsearch<mark> 自身带有分布式协调管理功能 </mark> 。4 3 、 Solr 支持更多格式的数据 , 比如 JSON 、 XML 、 CSV , 而Elasticsearch 仅支持 json 文件格式。5 4 、 Solr 官方提供的功能更多 , 而 Elasticsearch 本身更注重于核心功能,高级功能多有第三方插件提供,例如图形化界面需要 kibana 友好支撑6 5.Solr 查询快 , 但更新索引时慢 ( 即插入删除慢 ) ,用于电商等查询多的应用 ;78 ES 建立索引快 ( 即查询慢 ) ,即实时性查询快,用于 facebook 新浪等搜索。9 Solr 是传统搜索应用的有力解决方案,但 Elasticsearch<