MongoDB之索引(全文索引)

在一些信息管理平台上经常需要进行信息模糊查询,最早的时候是在某个字段上实现的模糊查询,但是这个时候返回的信息并不会很准确,因为只能够查A字段或者是B字段,而在MongoDB里面实现了非常简单的全文检索。

范例:定义一个新的集合
db.news.insert({"title":"stoneA","content":"ttA"});
db.news.insert({"title":"stoneB","content":"ttB"});
db.news.insert({"title":"stoneC","content":"ttC"});
db.news.insert({"title":"stoneD","content":"ttD"});

范例:创建全文索引
> db.news.createIndex({"title":"text","content":"text"});
{
        "createdCollectionAutomatically" : false,
        "numIndexesBefore" : 1,
        "numIndexesAfter" : 2,
        "ok" : 1
}

范例:实现数据的模糊查询
如果要想表示出全文检索,则使用“$text"判断符,而要想进行数据的查询则使用“$search”运算符:
  ● 查询指定的关键字:{"$search":"查询关键字"}
  ● 查询多个关键字(或关系):{"$search":"查询关键字 查询关键字 ..."}
  ● 查询多个关键字(与关系):{"$search":"\"查询关键字\" \"查询关键字\" ..."}
  ● 查询多个关键字(排除某一个):{"$search":"查询关键字 查询关键字 ...-排查关键字"}

范例:查询单个内容
> db.news.find({"$text":{"$search":"stoneA"}})
{ "_id" : ObjectId("5992c4310184ff511bf02bbb"), "title" : "stoneA", "content" : "ttA" }

范例:查询包含有“stoneA”和“stoneB”的信息
> db.news.find({"$text":{"$search":"stoneA stoneB"}})
{ "_id" : ObjectId("5992c4310184ff511bf02bbc"), "title" : "stoneB", "content" : "ttB" }
{ "_id" : ObjectId("5992c4310184ff511bf02bbb"), "title" : "stoneA", "content" : "ttA" }

范例:查询同时包含有“ttC”和“ttD”
> db.news.find({"$text":{"$search":"\"ttC\" \"ttD\""}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE" }
{ "_id" : ObjectId("5992c61d0184ff511bf02bc2"), "title" : "stoneD", "content" : "ttC ttD ttF" }

范例:查询包含有“ttE”但是不包含“ttF”
> db.news.find({"$text":{"$search":"ttE -ttF"}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE" }

但是在进行全文检索操作的时候还可以使用相似度的打分来判断检索结果。

范例:为查询结果打分
> db.news.find({"$text":{"$search":"ttC ttD ttE"}},{"score":{"$meta":"textScore"}}).sort({"score":{"$meta":"textScore"}})
{ "_id" : ObjectId("5992c61d0184ff511bf02bc1"), "title" : "stoneC", "content" : "ttC ttD ttE", "score" : 2 }
{ "_id" : ObjectId("5992c61d0184ff511bf02bc2"), "title" : "stoneD", "content" : "ttC ttD ttF", "score" : 1.3333333333333333 }

按照打分的成绩进行排列,实际上就可以实现更加准确的信息搜索。
如果一个集合的字段太多了,那么每一个字段都分别设置全文索引比较麻烦,简单一些,可以为所有字段设置全文索引。

范例:为所有字段设置全文索引
> db.news.dropIndexes()
{
        "nIndexesWas" : 2,
        "msg" : "non-_id indexes dropped for collection",
        "ok" : 1
}
> db.news.createIndex({"$**":"text"});
{
        "createdCollectionAutomatically" : false,
        "numIndexesBefore" : 1,
        "numIndexesAfter" : 2,
        "ok" : 1
}
这是一种最简单的设置全文索引的方式,但是尽可能别用,会慢。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/28536251/viewspace-2144104/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/28536251/viewspace-2144104/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值