20200326记录建立自己的搜索引擎过程
资料搜索阶段
根据老师给的学习资料,以及同学的分享。前期走马观花大概看了sphinx、scrapy以及elasticsearch。其中sphinx偏重理论部分,elasticsearch和scrapy倒是偏实战。但由于讲解scrapy的视频实在Linux环境下,我个人觉得整个编程环境看上去过于简陋,于是在搜索引擎方面最终选择elasticsearch进行开发。Elasticsearch,基于lucene的高扩展的分布式搜索器,优点:扩展性好、近实时地去索引和搜索数据。
what I need know
倒排索引表
记录的是:分词 文档 联系
传统:从文章找词
倒排索引:从词找文章
RESTful接口
elasticsearch给多种编程语言提供了API
基本流程
用户在前端搜索关键字
项目端通过http方式请求项目服务器
项目服务器通过HTTp Restful 方式请求ES集群进行搜索
ES集群从索引库检索数据
接下来就是分工和具体各自的学习辣辣