【学习笔记】分布式爬虫打造搜索引擎|笔记04|elasticsearch及其插件安装

当想要给网站或程序添加搜索功能,并且对服务有如下要求:

  1. 搜索解决方案高效
  2. 零配置和完全免费的搜索方案
  3. 能够简单的通过json和http与搜索引擎交互
  4. 搜索服务器稳定
  5. 能够简单的将一台服务器扩展到上百台

那么elasticsearch是非常合适的选择。

elasticsearch简单介绍

  • elasticsearch是基于Lucene的搜索服务器,基于Java开发。
  • 提供了一个分布式多用户能力的全文搜索引擎
  • 基于RESTful web接口

关系数据搜索缺点

  1. 无法打分,即无法排序
  2. 无分布式
  3. 无法解析搜索请求,即无法完成分词
  4. 效率低,当数据过多时,单库或单表无法满足需求
  5. 分词,中文中单个字无法表达具体意思,所以需要把词语进行分词处理。对汉语的分词比对英语的分词要求高,英语只需要以空格符号划分。

NoSql简单介绍

NoSQL = Not Only SQL

NoSQL四大分类:

  1. 键值(Key-Value)存储数据库,如 Redis
  2. 列存储数据库
  3. 文档型数据库 ,如 MongDb
  4. 图形(Graph)数据库

 

elasticsearch的安装

由于elasticsearch是Java编写,所以安装elasticsearch之前一定要安装JDK

官网下载到的elasticsearch插件不多,所以选择另一插件较多的版本:elasticsearch-rtf,https://github.com/medcl/elasticsearch-rtf

elasticsearch插件安装

1.head插件,可理解为Navicat,可以对elasticsearch里的数据执行查询语句

https://github.com/mobz/elasticsearch-head

要运行head插件还要安装npm,在https://nodejs.org/en/安装nodejs即可运行npm。

由于npm的仓库在国外服务器,下载很慢,故采用cnpm命令行工具代替默认的npm。安装cnpm:

npm install -g cnpm --registry=https://registry.npm.taobao.org

2.kibana安装(需要其中的sense插件)

kibana版本要与elasticsearch版本一致 https://www.elastic.co/downloads/kibana

 

elasticsearch及插件运行

1.elasticsearch运行:在其bin目录下执行命令:

.\elasticsearch.bat

打开127.0.0.1:9200,显示

即为elasticsearch启动成功。

2.elasticsearch-head插件运行,在该目录下执行命令:

cnpm run start

由于elasticsearch的安全策略默认拒绝第三方服务,所以当启动head插件以后,在127.0.0.1:9100查看不到elasticsearch内容。

修改elasticsearch目录下config中的elasticsearch.yml文件,添加

http.cors.enabled: true
http.cors.allow-origin: "*"
http.cors.allow-methods: OPTIONS, HEAD, GET, POST, PUT, DELETE
http.cors.allow-headers: "X-Requested-With,Content-Type, Content-Length, X-User"

3.kibana的运行,bin目录下执行命令:

.\kibana.bat

 

使用python脚本一次启动elasticsearch、head插件以及kibana,可以参考:https://blog.csdn.net/weixin_40643642/article/details/89893510

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值