1、Elasticsearch是基于Lucene开发的一个分布式全文检索框架,向Elasticsearch中存储和从Elasticsearch中查询,格式是json。
索引index,相当于数据库中的database。
类型type相当于数据库中的table。
主键id相当于数据库中记录的主键,是唯一的。
向Elasticsearch中存储数据,其实就是向es中的index下面的type中存储json类型的数据。
2、Elasticsearch是RestFul风格的api,通过http的请求形式(注意,参数是url拼接还是请求的json形式哦),发送请求,对Elasticsearch进行操作。
查询,请求方式应该是get。删除,请求方式应该是delete。添加,请求方式应该是put/post。修改,请求方式应该是put/post。
RESTFul接口url的格式:http://ip:port/<index>/<type>/<[id]>。其中index、type是必须提供的。id是可以选择的,不提供es会自动生成,index、type将信息进行分层,利于管理。
3、如何使用java连接Elasticsearch。由于使用的是maven项目,pom.xml的依赖如下所示:
1 <project xmlns="http://maven.apache.org/POM/4.0.0" 2 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 3 xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 4 http://maven.apache.org/xsd/maven-4.0.0.xsd"> 5 <modelVersion>4.0.0</modelVersion> 6 <groupId>com.bie</groupId> 7 <artifactId>elasticsearch-hello</artifactId> 8 <version>0.0.1-SNAPSHOT</version> 9 10 <properties> 11 <maven.compiler.source>1.8</maven.compiler.source> 12 <maven.compiler.target>1.8</maven.compiler.target> 13 <encoding>UTF-8</encoding> 14 </properties> 15 16 <dependencies> 17 <!-- elasticsearch的客户端 --> 18 <dependency> 19 <groupId>org.elasticsearch.client</groupId> 20 <artifactId>transport</artifactId> 21 <version>5.4.3</version> 22 </dependency> 23 <!-- elasticsearch依赖2.x的log4j --> 24 <dependency> 25 <groupId>org.apache.logging.log4j</groupId> 26 <artifactId>log4j-api</artifactId> 27 <version>2.8.2</version> 28 </dependency> 29 <dependency> 30 <groupId>org.apache.logging.log4j</groupId> 31 <artifactId>log4j-core</artifactId> 32 <version>2.8.2</version> 33 </dependency> 34 <!-- junit单元测试 --> 35 <dependency> 36 <groupId>junit</groupId> 37 <artifactId>junit</artifactId> 38 <version>4.12</version> 39 </dependency> 40 </dependencies> 41 42 43 </project>
使用查询的方式,先简单测试一下是否连通es集群,和对比查询的数据是否一致。
1 package com.bie.elasticsearch; 2 3 import java.net.InetAddress; 4 5 import org.elasticsearch.action.get.GetResponse; 6 import org.elasticsearch.client.transport.TransportClient; 7 import org.elasticsearch.common.settings.Settings; 8 import org.elasticsearch.common.transport.InetSocketTransportAddress; 9 import org.elasticsearch.transport.client.PreBuiltTransportClient; 10 11 /** 12 * 13 * @author biehl 14 * 15 */ 16 public class HelloElasticsearch { 17 18 public static void main(String[] args) { 19 try { 20 // 设置集群名称biehl01,Settings设置es的集群名称,使用的设计模式,链式设计模式、build设计模式。 21 Settings settings = Settings.builder().put("cluster.name", "biehl01").build(); 22 // 读取es集群中的数据,创建client。 23 @SuppressWarnings("resource") 24 TransportClient client = new PreBuiltTransportClient(settings).addTransportAddresses( 25 // 用java访问ES用的端口是9300。es的9200是restful的请求端口号 26 // 由于我使用的是伪集群,所以就配置了一台机器,如果是集群方式,将竞选主节点的加进来即可。 27 // new InetSocketTransportAddress(InetAddress.getByName("192.168.110.133"), 28 // 9300), 29 // new InetSocketTransportAddress(InetAddress.getByName("192.168.110.133"), 30 // 9300), 31 new InetSocketTransportAddress(InetAddress.getByName("192.168.110.133"), 9300)); 32 // 搜索数据(.actionGet()方法是同步的,没有返回就等待) 33 // 方式是先去索引里面查询出索引数据,再去文档里面查询出数据。 34 GetResponse response = client.prepareGet("news", "fulltext", "2").execute().actionGet(); 35 // 输出结果 36 System.out.println(response); 37 // 关闭client 38 client.close(); 39 } catch (Exception e) { 40 e.printStackTrace(); 41 } 42 43 } 44 45 }
查询的结果如下所示:
4、如何使用java api创建索引Index、类型Type、以及指定字段,是否创建索引,是否存储,是否即分词,又建立索引(analyzed)、是否建索引不分词(not_analyzed)等等。
1 package com.bie.elasticsearch; 2 3 import java.io.IOException; 4 import java.net.InetAddress; 5 import java.util.HashMap; 6 7 import org.elasticsearch.action.admin.indices.create.CreateIndexRequestBuilder; 8 import org.elasticsearch.client.AdminClient; 9 import org.elasticsearch.client.IndicesAdminClient; 10 import org.elasticsearch.client.transport.TransportClient; 11 import org.elasticsearch.common.settings.Settings; 12 import org.elasticsearch.common.transport.InetSocketTransportAddress; 13 import org.elasticsearch.common.xcontent.XContentBuilder; 14 import org.elasticsearch.common.xcontent.XContentFactory; 15 import org.elasticsearch.transport.client.PreBuiltTransportClient; 16 import org.junit.Before; 17 import org.junit.Test; 18 19 /** 20 * 21 * @author biehl 22 * 23 */ 24 public class AdminAPI { 25 26 private TransportClient client = null; 27 28 // 在所有的测试方法之前执行 29 @SuppressWarnings("resource") 30 @Before 31 public void init() throws Exception { 32 // 设置集群名称biehl01 33 Settings settings = Settings.builder().put("cluster.name", "biehl01") 34 // 自动感知的功能(可以通过当前指定的节点获取所有es节点的信息) 35 .put("client.transport.sniff", true).build(); 36 // 创建client 37 client = new PreBuiltTransportClient(settings).addTransportAddresses( 38 // new InetSocketTransportAddress(InetAddress.getByName("192.168.110.133"), 39 // 9300), 40 // new InetSocketTransportAddress(InetAddress.getByName("192.168.110.133"), 41 // 9300), 42 // 建议指定2个及其以上的节点。 43 new InetSocketTransportAddress(InetAddress.getByName("192.168.110.133"), 9300)); 44 } 45 46 /** 47 * 48 * AdminClient创建索引,并配置一些参数,用来指定一些映射关系等等 49 * 50 * 这里创建一个索引Index,并且指定分区、副本的数量 51 * 52 */ 53 @Test 54 public void createIndexWithSettings() { 55 // 获取Admin的API 56 AdminClient admin = client.admin(); 57 // 使用Admin API对索引进行操作 58 IndicesAdminClient indices = admin.indices(); 59 // 准备创建索引 60 indices.prepareCreate("food") 61 // 配置索引参数 62 .setSettings( 63 // 参数配置器 64 Settings.builder()// 指定索引分区的数量。shards分区 65 .put("index.number_of_shards", 5) 66 // 指定索引副本的数量(注意:不包括本身,如果设置数据存储副本为1,实际上数据存储了2份) 67 // replicas副本 68 .put("index.number_of_replicas", 1)) 69 // 真正执行 70 .get(); 71 } 72 73 /** 74 * 你可以通过dynamic设置来控制这一行为,它能够接受以下的选项: true:默认值。 75 * 76 * 动态添加字段 false:忽略新字段 77 * 78 * strict:如果碰到陌生字段,抛出异常 79 * 80