在今天的文章中,我将介绍如何使用 Go 语言来对 Elasticsearch 进行搜索。首先,我假设你已经对 Elastic Stack 有一定的了解。Elasticsearch 获得了极大的欢迎。 在关系数据库中搜索始终会遇到有关可伸缩性和性能的问题。Elasticsearch 是 NoSQL 数据库,在解决这些问题方面非常成功。 它提供了出色的可拓展性和性能,而最突出的功能之一就是相关性分析,它使搜索结果具有很大的灵活性。
Elastic Stack
安装 Elasticsearch 及 Kibana
如果你还没有安装好自己的 Elasticsearch 及 Kibana 的话,那么请参阅我之前的文章:
一旦完成好 Elasticsearch 及 Kibana 的安装,我们可以在浏览器中输入地址 http://localhost:9200 来进行访问:
我们也可以直接访问 Kibana:
创建你的第一个索引 (index)
在 Elasticsearch中,索引类似于数据库。 以前,elasticsearch 中有一个叫做 type 的表。 但是由于类型已在当前版本中删除,因此现在只有索引。
现在感到困惑吗? 不用了 简而言之,只需考虑只需要索引,然后再将数据插入 Elasticsearch 即可。
现在,我们将通过下面的查询创建一个名为 students 的索引。
PUT students
上面的命令的响应为:
{
"acknowledged" : true,
"shards_acknowledged" : true,
"index" : "students"
}
它已经为我们创建了一个名为 students 的索引。在接下的步骤中,我们将想这个索引里写入一些数据,也就是一些文档。
写入文档到索引中
首先,我们现在要做的是用文档填充我们的 Elasticsearch 索引。 如果你不熟悉该定义,请知道它与数据库中的行非常相似。我们使用如下的命令来把数据导入到 Elasticsearch 中:
POST students/_doc
{
"name": "Alice",
"age": 17,
"average_score": 85
}
上面的命令的响应为:
{
"_index" : "students",
"_type" : "_doc",
"_id" : "cMpCSnUBzapZdaLVYfwW",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 1,
"failed" : 0
},
"_seq_no" : 0,
"_primary_term" : 1
}
你的 Elasticsearch 现在应该有一个文档。 我们将需要在索引 students 中插入更多数据。 当然,我们不会一个接一个地插入我们的学生数据-这很麻烦!
Elasticsearch 特别准备了一个 bulk API,以便一次发送多个请求。 让我们用它一次插入多个数据。
POST students/_bulk
{ "index":{ } }
{ "name":"john doe","age":18, "average_score":77.7 }
{ "index":{} }
{ "name":"bob","age":16, "average_score":65.5 }
{ "index":{} }
{ "name":"mary doe","age":18, "average_score":97.7 }
{ "index":{} }
{ "name":"eve","age":15, "average_score":98.9 }
我们可以通过如下的命令来检查已经输入的 5 个文档:
GET students/_count
搜索索引文档
我们终于在 Elasticsearch 中填充了更多学生的数据。 现在,让我们来做一下 Elasticsearch 众所周知的事情:我们将尝试在 Elasticsearch 中搜索刚刚插入的数据。
Elasticsearch 支持多种类型的搜索机制,但在此示例中,我们将使用简单的匹配查询。
让我们通过点击以下 API 开始搜索:
GET students/_search
{
"query": {
"match": {
"name": "doe"
}
}
}
上面的命令显示:
{
"took" : 0,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value" : 2,
"relation" : "eq"
},
"max_score" : 0.74487394,
"hits" : [
{
"_index" : "students",
"_type" : "_doc",
"_id" : "hstFSnUBzapZdaLVQQCN",
"_score" : 0.74487394,
"_source" : {
"name" : "john doe",
"age" : 18,
"average_score" : 77.7
}
},
{
"_index" : "students",
"_type" : "_doc",
"_id" : "iMtFSnUBzapZdaLVQQCN",
"_score" : 0.74487394,
"_source" : {
"name" : "mary doe",
"age" : 18,
"average_score" : 97.7
}
}
]
}
}
上面将返回你的查询以及与你的相应查询匹配的学生数据。 现在,恭喜你你已经正式成为一名搜索工程师!
让我们使用 Go
如果你已经达到这一部分,那么你应该已经掌握了使用 Elasticsearch 的最低限度的概念。 现在,我们将在 Go 中实现 Elasticsearch。实施 Elasticsearch 的一种非常原始的方法是,你可以继续将 HTTP 请求发送到你的 Elasticsearch IP 中。 但是我们不会那样做。
我发现这个非常有用的库对于在 Go 中实现 Elasticsearch 很有帮助。 在继续执行 Go 模块之前,应先安装该库。我们可以使用如下的命令来进行安装:
go get github.com/olivere/elastic
创建你自己的 struct
首先,你肯定需要为模型制作一个结构。 在此示例中,我们将使用与先前示例相同的建模,在本例中为 Student 结构。
package main
type Student struct {
Name string `json:"name"`
Age int64 `json:"age"`
AverageScore float64 `json:"average_score"`
}
创建客户端连接
现在,让我们创建一个函数,该函数将允许我们初始化 ES Client 连接。
如果你在本地主机外部有一个正在运行的 Elasticsearch 实例,则只需更改 SetURL 中的部分即可。
func GetESClient() (*elastic.Client, error) {
client, err := elastic.NewClient(elastic.SetURL("http://localhost:9200"),
elastic.SetSniff(false),
elastic.SetHealthcheck(false))
fmt.Println("ES initialized...")
return client, err
}
数据插入
之后,我们要做的第一件事就是尝试通过 Go 将数据插入到 Elasticsearch 中。 我们将制作一个 Student 模型,并将其插入到我们的 Elasticsearch 客户端中。
insert.go
package main
import (
"context"
"encoding/json"
"fmt"
"github.com/olivere/elastic"
)
type Student struct {
Name string `json:"name"`
Age int64 `json:"age"`
AverageScore float64 `json:"average_score"`
}
func GetESClient() (*elastic.Client, error) {
client, err := elastic.NewClient(elastic.SetURL("http://localhost:9200"),
elastic.SetSniff(false),
elastic.SetHealthcheck(false))
fmt.Println("ES initialized...")
return client, err
}
func main() {
ctx := context.Background()
esclient, err := GetESClient()
if err != nil {
fmt.Println("Error initializing : ", err)
panic("Client fail ")
}
//creating student object
newStudent := Student{
Name: "Gopher doe",
Age: 10,
AverageScore: 99.9,
}
dataJSON, err := json.Marshal(newStudent)
js := string(dataJSON)
_, err = esclient.Index().
Index("students").
BodyJson(js).
Do(ctx)
if err != nil {
panic(err)
}
fmt.Println("[Elastic][InsertProduct]Insertion Successful")
}
我们可以使用它如下的命令来进行运行:
go run insert.go
上面的应用显示:
$ go run insert.go
ES initialized...
[Elastic][InsertProduct]Insertion Successful
我们可以通过 Kibana 来验证一下新的文档是否已经被成功地写入:
GET students/_search
{
"query": {
"match": {
"name": "Gopher doe"
}
}
}
上面显示我们的文档已经被成功地写入到 Elasticsearch 之中了。
查询数据
最后,我们可以进行一些搜索。 下面的代码可能看起来有些复杂。 但是请放心,在你仔细地进行操作之后,它对你会更有意义。 在下面的示例中,我将使用基本的匹配查询。
search.go
package main
import (
"context"
"encoding/json"
"fmt"
"github.com/olivere/elastic"
)
type Student struct {
Name string `json:"name"`
Age int64 `json:"age"`
AverageScore float64 `json:"average_score"`
}
func GetESClient() (*elastic.Client, error) {
client, err := elastic.NewClient(elastic.SetURL("http://localhost:9200"),
elastic.SetSniff(false),
elastic.SetHealthcheck(false))
fmt.Println("ES initialized...")
return client, err
}
func main() {
ctx := context.Background()
esclient, err := GetESClient()
if err != nil {
fmt.Println("Error initializing : ", err)
panic("Client fail ")
}
var students []Student
searchSource := elastic.NewSearchSource()
searchSource.Query(elastic.NewMatchQuery("name", "Doe"))
/* this block will basically print out the es query */
queryStr, err1 := searchSource.Source()
queryJs, err2 := json.Marshal(queryStr)
if err1 != nil || err2 != nil {
fmt.Println("[esclient][GetResponse]err during query marshal=", err1, err2)
}
fmt.Println("[esclient]Final ESQuery=\n", string(queryJs))
/* until this block */
searchService := esclient.Search().Index("students").SearchSource(searchSource)
searchResult, err := searchService.Do(ctx)
if err != nil {
fmt.Println("[ProductsES][GetPIds]Error=", err)
return
}
for _, hit := range searchResult.Hits.Hits {
var student Student
err := json.Unmarshal(hit.Source, &student)
if err != nil {
fmt.Println("[Getting Students][Unmarshal] Err=", err)
}
students = append(students, student)
}
if err != nil {
fmt.Println("Fetching student fail: ", err)
} else {
for _, s := range students {
fmt.Printf("Student found Name: %s, Age: %d, Score: %f \n", s.Name, s.Age, s.AverageScore)
}
}
}
我们使用如下的命令来运行:
go run search.go
查询应像这样打印出来:
ES initialized...
[esclient]Final ESQuery=
{"query":{"match":{"name":{"query":"Doe"}}}}
是的,该查询就是将要发布到 Elasticsearch 中的内容。如果从一开始就遵循我的示例,则查询结果也应如下所示:
Student found Name: john doe, Age: 18, Score: 77.700000
Student found Name: mary doe, Age: 18, Score: 97.700000
Student found Name: Gopher doe, Age: 10, Score: 99.900000
Hooray! 我们终于完成了第一个使用 Golang 把数据导入到 Elasticsearch 并进行搜索的过程。这个过程非常简单!
如果你想了解更多关于 Elasticsearch 的知识以及其它更为复杂的 DSL 查询,请阅读我的另外一篇文章 “Elastic:菜鸟上手指南”。