关闭

mongoDB的深入理解

236人阅读 评论(0) 收藏 举报
分类:

mongoDB的简介

分布式文件存储的NoSql
文档是mongoDB的基本单位,每一个文档都有与之对应的ID
文档里边可以是多个键值对
文档里边可以嵌套另一个文档
一个集合里边可以有多个文档
一个数据库里边可以有多个集合

聚集分析

1、管道模式进行聚集
常用的管道模式有以下
$match过滤文档,只传递匹配的文档到管道中的下一个步骤

db.book.insert({book_id:1,num:100,status:"normal"})
db.book.insert({book_id:2,num:200,status:"normal"})
db.book.insert({book_id:3,num:200,status:"sold"})
db.book.insert({book_id:1,num:200,status:"normal"})
db.price.aggregate([
                   {
                    $group:{
                        _id:"$book_id",
                       count:{$sum:1}
                       }
                    },
                       {$match:{count:{$gt:1}}
                    }
                   ])

会返回的结果

{
    "result" : [ 
        {
            "_id" : null,
            "count" : 5
        }
    ],
    "ok" : 1
}

limitskip:跳过指定数量的文档,返回剩下的文档
sortgroup : 对所有的文档进行分组,然后进行聚集结果
firstgrouplast:返回group的最后一个值
maxgroupmin:返回group的最小值
avggroupsum返回group的所有的值的和

SELECT count(*)  as count1 from books

会返回 count1 4
等价于

db.book.aggregate([
                   {
                    $group:{
                        _id:null,
                       count1:{$sum:1}
                       }
                    }
                   ])

SELECT sum(num)  as total from books

统计books表中所有num的和 会返回700
等价于

db.book.aggregate([
                   {
                    $group:{
                        _id:null,
                       sum:{$sum:"$num"}
                       }
                    }
                   ])

SELECT book_id, sum(num) as total   from books  GROUP BY book_id

实现分别统计相同的book_id的总体的num值

db.book.aggregate([
                   {
                    $group:{
                        _id:"$book_id",
                       total:{$sum:"$num"}
                       }
                    }
                   ])

MapReduce模聚集
为海量数据数据的查询分析,用mongoDB的做分布式,然后再用MapReduce 做数据分析

Select sum(num) as value,book_id as _id 6yh from books where status ="normal" group by book_id

查询到的结果为
value _id
300 1
200 2
使用mongoDB的执行

Db.books.mapreduce({

Function(){emit(this.book_id,this.num);},

Function(key,values){return Array.sum(values);},

{

Query:{status:"normal"},

Outresult:"books_totals"

}

})

代码分析:

以上相当于关系数据库中如下sql

Select sum(num) as value,book_id as _id 6yh from books where status =”normal” group by book_id

Mapreduce的解决方案:

定义一个map
Function(){emit(this.book_id,this.num);}

定义reduce
Function(key,values){return Array.sum(values);}

执行mapreduce函数
Query:{status:”normal”},返回状态为normal的值,同时定义了保存结果的集合名,最后的输出结果将保存在集合books_totals中。

注意:这里的map、reduce函数都是利用javascript编写的函数,其中map函数的关键部分是emit(key,value)函数,此函数的调用使集合使集合中的document对象按照key值生成一个value,形成一个键值对。其中key可以单一field,也可以由多个field组成,mongodb会按照key生成对应的value值,value为一个数组。

Reduc函数的定义中有参数key和value,其中key就是上面map函数中指定的key值,value就是对应key对应的值,Array.sum(value)这里是对数组中的值求和,按照不同的业务需要,我们可以编写自己的js函数来处理。
3、简单聚集函数
1、distinct函数
db.orders.distinct(key,)
第一个参数为filed 第二个参数为查询选择器

 db.book.distinct("book_id")

会选择出所有文档中不同的book_id
2、count函数 用于统计查询返回的记录总数

 db.book.find().count()

会返回4

node版原生的mongoDB驱动

1、声明依赖关系
2、定义数据库主机端口
3、建立数据库连接
4、创建数据库文档
5、输出一个新创建的文档

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:26081次
    • 积分:870
    • 等级:
    • 排名:千里之外
    • 原创:73篇
    • 转载:1篇
    • 译文:0篇
    • 评论:2条
    文章分类
    最新评论