Mongodb Manual阅读笔记：CH7 索引

在secondary中创建大索引最好的方式是，重启secondary到standalone状态，然后创建索引，创建完之后再加入到复制集，然后赶上primary之间的滞后。然后在下一个secondary上创建。当所有的secondary建好之后，切换primary，然后重启变为standalone，创建索引。

当在secondary上创建索引的时候，oplog需要有足够的空间。

7.2.3.2 删除重复

当collection中有重复键，那么就无法创建唯一索引，可以使用dropDups选项强制删除索引，会报存第一个key，接下来的重复的key的文档都会被删除。

如：

db.accounts.ensureIndex( { username: 1 }, { unique: true, dropDups: true } )

默认这个选项为false

7.2.3.3 索引名

默认索引名和key，排序顺序有关，如：db.products.ensureIndex( { item: 1, quantity: -1 } )的索引名为：item_1_quantity_-1，可以使用以下来修改指定索引名：

db.products.ensureIndex( { item: 1, quantity: -1 } , { name: "inventory" } )

7.3索引教程

本节介绍，索引创建，索引管理，地理空间索引，文本搜索，索引策略

7.3.1创建索引

7.3.1.1创建一个索引

Mongodb默认会在_id上创建一个索引，并允许用户在任意字段上创建索引

在单个字段上创建索引

可以使用ensureIndex()在单个字段上创建索引。

如：db.people.ensureIndex( { "phone-number": 1 } )

额外考虑：如果collection太大，可以考虑后台创建，让数据库处于可用状态，不会被堵塞。

7.3.1.2创建复合索引

复合索引好处，是提供了索引覆盖，可以直接从索引中返回数据。

创建复合索引：db.collection.ensureIndex( { a: 1, b: 1, c: 1 } )

额外考虑：如果collection太大，可以考虑后台创建，让数据库处于可用状态，不会被堵塞。

7.3.1.3创建唯一索引

唯一索引只是索引的一个属性

db.collection.ensureIndex( { a: 1 }, { unique: true } )

一般唯一索引和稀疏索引一起使用：db.collection.ensureIndex( { a: 1 }, { unique: true, sparse: true } )

也可以在复合索引上创建唯一属性。

删除重复：可以删除重复的key

db.collection.ensureIndex( { a: 1 }, { unique: true, dropDups: true } )

7.3.1.4创建稀疏索引

稀疏索引和非稀疏索引不同，非稀疏索引会包含所有的文档，如果没有这个字段用null填充，稀疏索引如果文档没有这个字段，那么就不会为这个文档index。

db.collection.ensureIndex( { a: 1 }, { sparse: true } )

7.3.1.5创建hash索引

Hash索引时对索引字段进行hash计算，只能用户等号的匹配，不能用于区间匹配。

db.collection.ensureIndex( { _id: "hashed" } )

考虑：hash索引可以在任何字段上创建，包括子文档，会把所有的的内容计算hash，不支持multikey。

7.3.1.6在复制集上创建索引

后台创建索引在secondary会变成前台，前台创建索引会把复制block，secondary会在primary创建了索引之后再创建，如果在shard中有复制集，那么会现在shard的primary上创建，然后再secondary上创建。

注意点

需要保证oplog有足够的空间，用来保存延迟。

过程

1.关闭一个Secondary：先关闭一个secondary然后以启动不加—replSet选项，使用不同的端口运行。

2.创建索引：使用ensure创建索引

3.重启mongod：创建完之后重启mongod加上选项—replSet修改到原来的端口。

4.在所有secondary上创建索引：每个secondary根据以上1-3步创建索引

5.在primary上创建索引二选一：

a.先在primary在上是有后台创建索引

b.然后关闭primary，让别的secondary变成primary，在通过1-3步创建索引。

在后台创建索引，会比前台创建索引时间长，并且紧凑性比较差，并且会影响primary写入性能。

7.3.1.7后台创建索引

前台索引创建会block数据，后台索引创建可以让数据库任然可用，在后台索引创建时，数据库申请读写锁不会被获取。

db.collection.ensureIndex( { a: 1 }, { background: true } )

7.3.1.8创建老式索引

手册page346

7.3.2索引管理教程

本节介绍对索引的管理：删除所有，重建索引，管理在创建的索引，返回所有索引，评估索引的使用

7.3.2.1删除所有

可以使用dropIndex()方法来删除索引，db.accounts.dropIndex( { "tax-id": 1 } )

返回{ "nIndexesWas" : 3, "ok" : 1 }

nindexesWas表示删除之前的索引个数，

可以使用db.collection.dropIndex()来删除collection下的所有索引。

7.3.2.2重建索引

使用db.collection.reIndex()方法来重建collection下的所有索引。

7.3.2.3管理在建索引

可以使用db.curentOp()，msg字段会指明是否在创建索引，进度。如果不想再创建可以使用db.killop来停止创建。

7.3.2.4返回所有索引

索引的元数据存放在system.indexex下面

获取collection下的索引

db.people.getIndexes()

获取数据库下的所有索引

db.system.indexes.find()

7.3.2.5评估索引的使用

查询性能能够很好的指明索引的使用

操作

使用explain返回执行计划：在cursor下有个explain查看查询执行计划，其中包含了使用的索引。

使用hint：使用hint来强制使用索引

db.people.find( { name: "John Doe", zipcode: { $gt: 63000 } } } ).hint( { zipcode: 1 } )

使用报表：

serverStatus的输出indexCounters，scanned，scanAndOrder

collStats的输出totalIndexSize，indexSizes

dbStats的输出dbStats.indexes，bStats.indexSize

7.3.3地理空间索引教程

手册p349

7.3.4文本查询教程

本节介绍，启动文本查询，创建文本索引，查询文本，指定语言，为文本索引创建名称，使用权重控制查询结果，限制没扫描的文档，创建覆盖索引

7.3.4.1启动文本查询

文本查询现在还是beta版本，一下特性：

1.需要先启动文本查询

2.如果要为shard或者复制集启动文本查询，要在每个mongod中都启动

mongod --setParameter textSearchEnabled=true

也可以在配置文件中设置textSearchEnable。

7.3.4.2创建文本索引

可以在多个包含字符串或者字符串数组上面创建文本索引

指定字段

db.collection.ensureIndex(

{

subject: "text",

content: "text"

})

为所有字段创建索引

为所有是字符串的字段创建索引可以使用，通配符（$**）

db.collection.ensureIndex(

{ "$**": "text" },

{ name: "TextIndex" }

)

7.3.4.3查询文本

按组查询（Search For a Term）

db.quotes.runCommand( "text", { search: "TOMORROW" } )

文本是大小写敏感的，使用text命令查询。

匹配任意一个查询组

db.quotes.runCommand( "text", { search: "tomorrow largo" } )

查询包含tomorrow或者largo的文档

短语匹配

db.quotes.runCommand( "text", { search: "\"and tomorrow\"" } )

这个可以用来匹配and tomorrow短语

查询的时候有短语和独立的组时，短语和组之间使用and，组和组之间使用or

db.quotes.runCommand( "text", { search: "\"and tomorrow\"" } )

类似于(corto OR largo OR tomorrow) AND ("and tomorrow")

Tomorrow来至于短语。

匹配非某个单词之外的

db.quotes.runCommand( "text" , { search: "tomorrow -petty" } )

匹配tomorrow，但是不包含petty

限制匹配的结果集

默认text命令会返回100个文档，可以使用limit来限制返回

db.quotes.runCommand( "text", { search: "tomorrow", limit: 2 } )

指定返回结果集的列

Text命令中可以使用project来控制返回的列，1返回，0不返回

db.quotes.runCommand( "text", { search: "tomorrow",

project: { "src": 1 } } )

使用其他的查询条件过滤

Text命令的filter选项提供了这个功能。之间是and关系

db.quotes.runCommand( "text", { search: "tomorrow",

filter: { speaker : "macbeth" } } )

指定特定的语言查询

语言决定了stop word和stem word

db.quotes.runCommand( "text", { search: "amor", language: "spanish" } )

文本查询的输出

文本查询的结果以文档的方式输出

7.3.4.4指定语言

为文本索引指定默认语言

如果不填默认语言，语言为英语。如果要指定不同的语言可以在创建索引的时候指定。

db.collection.ensureIndex(

{ content : "text" },

{ default_language: "spanish" }

)

创建多语言的文本索引

在文档中指定语言：

1.如果文档保存一个language的字段，默认创建索引的时候会以这个字段为语言，来覆盖默认的英文

2.如果语言字段没有language字段，而是别的字段，那么在索引创建的时候，使用language_override指向这个字段。

包含language字段：

{ _id: 1, language: "portuguese", quote: "A sorte protege os audazes" }

{ _id: 2, language: "spanish", quote: "Nada hay más surreal que la realidad." }

{ _id: 3, language: "english", quote: "is this a dagger which I see before me" }

db.quotes.ensureIndex( { quote: "text" } )

如果文档里面有language，创建索引使用这个语言

如果没有，则使用英文。

db.quotes.runCommand( "text", { search: "que", language: "spanish" } )

因为在西班牙语上面que是stop word 所以匹配不到任何东西。

指定一个字段作为语言：

可以使用language_override选项上指定字段作为语言

{ _id: 1, idioma: "portuguese", quote: "A sorte protege os audazes" }

{ _id: 2, idioma: "spanish", quote: "Nada hay más surreal que la realidad." }

{ _id: 3, idioma: "english", quote: "is this a dagger which I see before me" }

db.quotes.ensureIndex( { quote : "text" },

{ language_override: "idioma" } )

1.如果包含idioma字段，那么以这个字段里面的语言作为语言

2.如果没有用英语

7.3.4.5为文本索引创建名字

默认文本索引创建好后，mongo会自动为这个索引创建一个名字

db.collection.ensureIndex(

{

content: "text",

"users.comments": "text",

"users.profiles": "text"

}

)

"content_text_users.comments_text_users.profiles_text"

当然也可以指定索引名

db.collection.ensureIndex(

{content: "text",

"users.comments": "text",

"users.profiles": "text"

{name: "MyTextIndex"}

)

7.3.4.6使用权重控制查询

默认text命令根据分数(scores)从高到低来匹配文档。对于文本索引来说，权重就表示这个字段和其他字段对于查询组来说的重要性。

默认所有的索引字段的权重都是1，可以在创建索引的时候调整

db.blog.ensureIndex(

{

content: "text",

keywords: "text",

about: "text"

{

weights: {

content: 10,

keywords: 5,

name: "TextIndex"

}

)

7.3.4.7限制扫描行数

就是用索引来现在扫描行数

{ _id: 1, dept: "tech", description: "a fun green computer" }

{ _id: 2, dept: "tech", description: "a wireless red mouse" }

{ _id: 3, dept: "kitchen", description: "a green placemat" }

{ _id: 4, dept: "kitchen", description: "a red peeler" }

{ _id: 5, dept: "food", description: "a green apple" }

{ _id: 6, dept: "food", description: "a red potato" }

db.inventory.runCommand( "text", {

earch: "green",

filter: { dept : "kitchen" }

})

db.inventory.ensureIndex({

dept: 1,

description: "text"

})

因为会扫描过滤特定的字段kitchen，然后创建一个符合索引把dept放在前面。

1.排序索引必须在文本索引的前面

2.只会对符合prefix的进行索引

3.不能再有multikey索引或者地理空间索引

4.text命令必须要办filter，并且使用等号条件。

这样的话指定的dept会限制扫描的行数

7.3.4.8创建文本覆盖索引

1.添加text到排序索引中

2.使用text命令的时候使用project限制字段。

db.collection.ensureIndex( { comments: "text",username: 1 } )

db.quotes.runCommand( "text", { search: "tomorrow",project: { username: 1,_id: 0}})

7.3.5索引策略

当设计索引的时候，要考虑读写的比例，内存，查询的类型。

在创建索引的时候，要知道所有的查询，虽然索引有性能的消耗，但是对查询的效果是很明显的。

要验证索引是否还有用，哪些运行的最好，如果这个索引没用了，那么请干掉。

7.3.5.1创建索引支持查询

当所有覆盖的时候mongo获取扫描索引，而不是从collection中要数据。

如果所有的查询使用相同的单个key创建单字段索引

如果你的索引只对一个key进行查询那么创建一个单字段索引。

为不同的查询创建复合索引

复合索引有多个key组成，主要复合prefix，都可以使用到复合索引。

创建覆盖索引

覆盖索引是为了让mongo不再去扫描collection中的数据

1.所有的查询中的字段都要在索引中

2.所有结果返回的字段也要在索引中

这样效率比较高，因为索引要不再内存中，要不就是在磁盘中但是是顺序的。

使用explain()中的indexOnly如果为true那么就是覆盖的，否则就不是

7.3.5.2为排序的查询提供顺序

可以使用索引里面的排序，为查询提供了很好的性能。

如果索引时一个覆盖索引，并且查询时索引的prefix，并且前面是使用相等的匹配，那么就可以使用索引的排序。或者排序时覆盖索引的prefix，也可以使用索引的排序。

explain()返回中如果scanAndOrder为false说明可以使用索引顺序

7.3.5.3保证索引都在内存中

使用db.collection.totalIndexSize()函数查看索引大小，保证加上workset之后比物理内存小。如果有多个collection，那么要看所有的索引大小和workset都可以同时在内存中。

只保存当前数据在内存中

有些索引时不需要全部都在内存中的，只要保证最常用的在内存中的就可以了。

7.3.5.4保证查询的选择性

选择性是使用索引限制返回行数的能力，低选择性的索引对查询本身就没有什么很大的好处。可以让多个低选择性的字段组合成复合索引，来提高选择性，或者低选择性的字段和高选择性的字段组合成复合索引。

低选择性可能比查询整个collection还要慢。

7.4索引指南

手册p374

posted on 2014-02-28 17:42 Fanr_Zh 阅读( ...) 评论( ...) 编辑收藏

转载于:https://www.cnblogs.com/Amaranthus/p/3574058.html

dida4700

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫