全文搜索引擎 Elasticsearch 入门教程

最新推荐文章于 2024-12-31 17:15:46 发布

u010142437

最新推荐文章于 2024-12-31 17:15:46 发布

阅读量1.1k

点赞数 28

文章标签： elasticsearch 大数据搜索引擎

本文链接：https://blog.csdn.net/u010142437/article/details/139279375

版权

本文是一篇关于Elasticsearch入门教程，介绍了从安装、基本概念、新建和删除Index、中文分词设置到数据操作和查询的详细步骤。Elasticsearch作为全文搜索引擎，适用于处理和搜索海量数据。文章还涉及了Node、Cluster、Index、Document和Type等核心概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

全文搜索属于最常见的需求，开源的 Elasticsearch （以下简称 Elastic）是目前全文搜索引擎的首选。

它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github 都采用它。

Elastic 的底层是开源库 Lucene。但是，你没法直接用 Lucene，必须自己写代码去调用它的接口。Elastic 是 Lucene 的封装，提供了 REST API 的操作接口，开箱即用。

本文从零开始，讲解如何使用 Elastic 搭建自己的全文搜索引擎。每一步都有详细的说明，大家跟着做就能学会。

一、安装

Elastic 需要 Java 8 环境。如果你的机器还没安装 Java，可以参考这篇文章，注意要保证环境变量JAVA_HOME正确设置。

安装完 Java，就可以跟着官方文档安装 Elastic。直接下载压缩包比较简单。

$ wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.1.zip
$ unzip elasticsearch-5.5.1.zip
$ cd elasticsearch-5.5.1/

wget 默认安装在当前目录，提前建好需要安装的目录，到指定目录执行上述命令，即可下载安装包，并解压。

更改文件夹所属者

因为elasticsearch 不能使用root用户启动，需要用普通用户启动，如果本来就用普通用户登录，可不用更改 ,命令 chown -R test:test elasticsearch-5.5.1

接着，进入解压后的目录，运行下面的命令，启动 Elastic。

./bin/elasticsearch

如果这时报错"max virtual memory areas vm.maxmapcount [65530] is too low"，要运行下面的命令。

sudo sysctl -w vm.max_map_count=262144

如果一切正常，Elastic 就会在默认的9200端口运行。这时，打开另一个命令行窗口，请求该端口，会得到说明信息。

$ curl localhost:9200

{
  "name" : "atntrTf",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "tf9250XhQ6ee4h7YI11anA",
  "version" : {
    "number" : "5.5.1",
    "build_hash" : "19c13d0",
    "build_date" : "2017-07-18T20:44:24.823Z",
    "build_snapshot" : false,
    "lucene_version" : "6.6.0"
  },
  "tagline" : "You Know, for Search"
}

上面代码中，请求9200端口，Elastic 返回一个 JSON 对象，包含当前节点、集群、版本等信息。

按下 Ctrl + C，Elastic 就会停止运行。

默认情况下，Elastic 只允许本机访问，如果需要远程访问，可以修改 Elastic 安装目录的config/elasticsearch.yml文件，去掉network.host的注释，将它的值改成0.0.0.0，然后重新启动 Elastic。