重建索引原因分析
一个 field 的设置是不能修改的,如果要修改一个 field,那么应该重新按照新的mapping,建立一个index,然后将数据批量查询出来,重新用 bulk api 写入到新的index中。
批量查询的时候,建议采用scroll api,并且采用多线程并发的方式来reindex数据,每次scroll就查询指定日期扽一段数据,交给一个线程即可。
重建索引
# 创建一个索引并写入一条数据,根据数据动态建立mapping,content类型设为date
PUT /index1/type1/4
{
"content": "1990-12-12"
}
# 查询数据
GET /index1/type1/_search
# 查看mapping
GET /index1/type1/_mapping
# 下面的PUT报错,因为前面的写入,动态设定了mapping中content被设定为date类型
PUT /index1/type1/4
{
"content": "I am very happy."
}
# 修改content的类型为string,报错,mapping一旦设定将不能修改
PUT /index1/_mapping/type1
{
"properties": {
"content": {
"type": "text"
}
}
}
# 通过下面的方案,解决上面的问题
# 创建一个新的索引,把index1索引中数据查询出来导入到新的索引中
# 但是应用程序使用的是之前的索引,为了不用重启应用程序,给index1这个索引起个别名
PUT /index1/_alias/index2
# 创建新的索引,把content的类型改为字符串
PUT /newindex
{
"mappings": {
"type1": {
"properties": {
"content": {
"type": "text"
}
}
}
}
}
# 使用scroll批量查询
GET /index1/type1/_search?scroll=1m
{
"query": {
"match_all": {}
},
"sort": {
"_doc"
},
"size": 2
}
# 使用bulk批量写入新的索引
POST /_bulk
{
"index": {
"_index": "newindex",
"_type": "type1",
"_id": 1
}
}
{
"content": "1990-12-12"
}
# 将别名index2和新索引关联,应用程序不用重启
POST /_aliases
{
"actions": [
{
"remove": {
"index": "index1",
"alias": "index2"
}
},
{
"add": {
"index": "newindex",
"alias": "index2"
}
}
]
}
GET index2/type2/_search