上篇文章中介绍了MongoDB中索引的简单操作,创建、查看、删除等基本操作,不过上文只介绍了一种类型的索引,本文来看看其他类型的索引。
_id 索引
在上文介绍过,我们往集合中添加文档时,默认情况下MongoDB都会帮助我们创建一个名为_id的字段,这个字段就是一个索引。默认情况下,一般的集合都会帮我们创建这个字段作为索引,但也有一些集合不会将_id默认作为索引,比如固定集合,这个在后面的文章中会详细说到。
复合索引
如果我们的查询条件有多个的话,我们可以对这多个查询条件都建立索引。比如我们可以对文档中的x和y字段都建立索引,如下:
db.index_2.createIndex({x:1,y:-1})
此时执行如下查询语句,就会用到这个复合索引:
db.index_2.find({x:50,y:50})
也可以通过查看查询计划,来确定确实使用到了上文创建好的索引。
过期索引
顾名思义,过期索引就是一种会过期的索引,在索引过期之后,索引对应的数据会被删除。创建方式如下:
db.index_3.createIndex({updateTime:1},{expireAfterSeconds:30})
expireAfterSeconds表示索引的过期时间,单位为秒。updateTime是索引的字段,数据类型必须是ISODate或者ISODate数组,否则的话,当索引到期之后,updateTime的数据就不会被删除。
简单来讲,索引过期之后,包含该字段的所有文档会被删除。
全文索引
全文索引虽然好用,可惜不支持中文,这里先做一个简单的了解。
比如,我的数据集如下:
{
"_id":ObjectId("61a4a21ccabe6ec34c4cd034"),
"x":"Java C# Python PHP"
}
{
"_id":ObjectId("61a4a225cabe6ec34c4cd035"),
"x":"Java C#"
}
{
"_id":ObjectId("61a4a22ecabe6ec34c4cd036"),
"x":"Java Python"
}
{
"_id":ObjectId("61a4a237cabe6ec34c4cd037"),
"x":"PHP Python"
}
{
"_id":ObjectId("61a4a23fcabe6ec34c4cd038"),
"x":"C C++"
}
我们可以给x字段建立一个全文索引,创建方式如下:
db.index_4.createIndex({x:"text"})
MongoDB会自动对x字段的数据进行分词,然后我们就可以通过如下语句进行查询:
db.index_4.find({$text:{$search:"Java"}})
此时x中包含Java的文档都会被查询出来。
如果想查询既包含Java又包含C#的文档,操作如下:
db.index_4.find({$text:{$search:"\"Java C#\""}})
如果想查询包含PHP或者Python的文档,操作如下:
db.index_4.find({$text:{$search:"PHP Python"}})
如果想查询包含PHP或者Python,但是不包含C#的文档,操作如下:
db.index_4.find({$text:{$search:"PHP Python -C#"}})
建立了全文索引之后,我们也可以查看查询结果的相似度,使用 $meta,如下:
db.index_4.find({$text:{$search:"PHP Python"}},{score:{$meta:"textScore"}})
此时查询结果中会多出一个 score 字段,该字段的值越大,表示相似度越高。
我们可以根据 score 利用 sort 来对其进行排序,如下:
db.index_4.find({$text:{$search:"PHP Python"}},{score:{$meta:"textScore"}}).sort({score:{$meta:"textScore"}})
结果如下:
全文索引目前看起来功能还是很强大,可惜暂时不支持中文。
地理空间索引
地理空间索引类型
地理空间索引可以分为两类:
1. 2d索引,可以用来存储和查找平面上的点
2. 2d sphere索引,可以用来存储和查找球面上的点
2d 索引
2d索引我们一般可以用在游戏地图中。
向集合中插入一条记录点的数据:
db.index_5.insert({x:[90,0]})
插入数据的格式为 [经度,纬度],取值范围:经度[-180,180],纬度[-90,90]。
数据插入成功之后,我们先通过如下命令创建索引:
db.index_5.createIndex({x:"2d"})
然后通过 $near 我们可以查询某一个点附近的点,如下:
db.index_5.find({x:{$near:[90,0]}})
默认情况下返回该点附近100个点。我们可以通过 $maxDistance 来设置返回的最远距离:
db.index_5.find({x:{$near:[90,0],$maxDistance:99}})
我们也可以通过 $geoWithin 查询某个形状内的点,比如查询矩形中的点:
db.index_5.find({x:{$geoWithin:{$box:[[0,0],[91,1]]}}})
两个坐标点用来确定矩形的位置。
查询圆形中的点:
db.index_5.find({x:{$geoWithin:{$center:[[0,0],90]}}})
参数分别表示圆的圆心和半径。
查询多边形中的点:
db.index_5.find({x:{$geoWithin:{$polygon:[[0,0],[0,1],[100,1],[100,0]]}}})
这里可以填入任意多个点,表示多边形中的各个点。
2d sphere 索引
2d sphere适用于球面类型的地图,它的数据类型是GeoJSON格式的,我们可以在 geojson.io 地址上查看 GeoJSON格式的样式。
比如我们描述一个点,GeoJSON如下:
{
"_id" : ObjectId("59f5e0571f9e8e181ffc3196"),
"name" : "shenzhen",
"location" : {
"type" : "Point",
"coordinates" : [
90.0,
0.0
]
}
}
描述线,GeoJSON格式如下:
{
"_id" : ObjectId("59f5e0d01f9e8e181ffc3199"),
"name" : "shenzhen",
"location" : {
"type" : "LineString",
"coordinates" : [
[
90.0,
0.0
],
[
90.0,
1.0
],
[
90.0,
2.0
]
]
}
}
描述多边形,GeoJSON格式如下:
{
"_id" : ObjectId("59f5e3f91f9e8e181ffc31d0"),
"name" : "beijing",
"location" : {
"type" : "Polygon",
"coordinates" : [
[
[
0.0,
1.0
],
[
0.0,
2.0
],
[
1.0,
2.0
],
[
0.0,
1.0
]
]
]
}
}
还有其他的类型,具体可以参考 geojson.io 。有了数据之后,我们就可以通过如下操作来创建地理空间索引了:
db.index_6.createIndex({location:"2dsphere"})
比如我想查询和深圳这个区域有交集的文档,如下:
var shenzhen = db.index_6.findOne({name:"shenzhen"})
db.index_6.find({location:{$within:{$geometry:shenzhen.location}}})
也可以查询腾讯附近的其他位置,如下:
var tencent = db.index_6.findOne({name:"tencent"})
db.index_6.find({location:{$near:{$geometry:tencent.location}}})
复合地理空间索引
位置往往只是我们查询的一个条件,比如我要查询深圳市内的所有学校,那我得再增加一个查询条件,如下:
var shenzhen = db.index_6.findOne({name:"shenzhen"})
db.index_6.find({location:{$within:{$geometry:shenzhen.location}},name:"school"})
其他的查询条件跟在后面就行了。