MongoDB聚合运算符：$stdDevPop

最新推荐文章于 2024-05-20 20:26:39 发布

原子星

最新推荐文章于 2024-05-20 20:26:39 发布

阅读量1.4k

点赞数 9

分类专栏： mongodb 文章标签： mongodb 数据库

本文链接：https://blog.csdn.net/superatom01/article/details/138325591

版权

mongodb 专栏收录该内容

221 篇文章 0 订阅

订阅专栏

MongoDB聚合运算符：$stdDevPop

文章目录

MongoDB聚合运算符：$stdDevPop

$stdDevPop聚合运算符用来计算输入值的总体标准差。如果确认数据代表了整个数据集，且不希望对更大的群体进行归纳，可以使用 $stdDevPop来计算总体标准差。如果数据仅代表了总体的一部分样本，但又想把结论推广到整个数据集，则应该使用 $stdDevSamp。

$stdDevPop可以应用于下面的阶段：

$addFields，从MongoDB3.4开始支持
$group
$match阶段的$expr表达式
$project
$replaceRoot，从MongoDB 3.4开始支持
$replaceWith，从MongoDB 4.2开始支持
$set，从MongoDB 4.2开始支持
$setWindowFields，从MongoDB 5.0开始支持

语法

当用于$bucket、$bucketAuto、$group和$setWindowFields阶段时的语法为：

{ $stdDevPop: <expression> }

当用于其它阶段时，$stdDevPop的语法有两种形式：

操作数为一个表达式：
```
{ $stdDevPop: <expression> }
```

操作数为一个表达式列表：

 { $stdDevPop: [ <expression1>, <expression2> ... ]  }

<expression>为可解析为数组的表达式。

参数可以是任何能够解析为数组的表达式。

使用

非数值类型的值

$stdDevPop忽略所有非数值的值，如果所有的操作数都是非数值的值，$stdDevPop返回null。

单个值

如果样本只有一个数值类型的值，$stdDevPop返回0。

数组操作数

在$group和$setWindowFields阶段，如果表达式解析为数组，$stdDevPop会将操作数视为非数字值，对计算没有影响。

针对其它阶段：

当使用单个表达式作为操作数时，如果表达式解析为数组，$stdDevPop会遍历数组元素，并对数字元素进行操作返回单个值。
当使用表达式列表作为操作数，如果表达式解析为数组，$stdDevPop不会遍历该数组，而是将数组视为非数字值。

窗口值

对于$setWindowFields阶段窗口的值：

忽略窗口中的非数值、空值和缺失字段。
如果窗口为空，则返回 null。
如果窗口中包含 NaN 值，则返回空值。
如果窗口包含 Infinity 值，则返回空值。
如果前面几点都不适用，则返回一个 double 值。

举例

应用于`$group`阶段

使用下面的脚本创建users集合：

db.users.insertMany( [
   { _id : 1, name : "dave123", quiz : 1, score : 85 },
   { _id : 2, name : "dave2", quiz : 1, score : 90 },
   { _id : 3, name : "ahn", quiz : 1, score : 71 },
   { _id : 4, name : "li", quiz : 2, score : 96 },
   { _id : 5, name : "annT", quiz : 2, score : 77 },
   { _id : 6, name : "ty", quiz : 2, score : 82 }
] )

下面的例子计算测验的标准差：

db.users.aggregate( [
   { $group: { _id: "$quiz", stdDev: { $stdDevPop: "$score" } } }
] )

操作结果如下：

{ "_id" : 2, "stdDev" : 8.04155872120988 }
{ "_id" : 1, "stdDev" : 8.04155872120988 }

在`$project`阶段使用

使用下面的脚本创建quizzes集合：

db.quizzes.insertMany( [
   {
      _id : 1,
      scores : [
         { name : "dave123", score : 85 },
         { name : "dave2", score : 90 },
         { name : "ahn", score : 71 }
      ]
   },
   {
      _id : 2,
      scores : [
         { name : "li", quiz : 2, score : 96 },
         { name : "annT", score : 77 },
         { name : "ty", score : 82 }
      ]
   }
] )

下面的示例计算了每次测验的标准差：

db.quizzes.aggregate( [
   { $project: { stdDev: { $stdDevPop: "$scores.score" } } }
] )

操作结果如下：

{ "_id" : 2, "stdDev" : 8.04155872120988 }
{ "_id" : 1, "stdDev" : 8.04155872120988 }

在`$setWindowFields`阶段使用

使用下面的脚本创建cakeSales集合，包含了在加利福尼亚州（CA）和华盛顿州（WA）的蛋糕销售记录：

db.cakeSales.insertMany( [
   { _id: 0, type: "chocolate", orderDate: new Date("2020-05-18T14:10:30Z"),
     state: "CA", price: 13, quantity: 120 },
   { _id: 1, type: "chocolate", orderDate: new Date("2021-03-20T11:30:05Z"),
     state: "WA", price: 14, quantity: 140 },
   { _id: 2, type: "vanilla", orderDate: new Date("2021-01-11T06:31:15Z"),
     state: "CA", price: 12, quantity: 145 },
   { _id: 3, type: "vanilla", orderDate: new Date("2020-02-08T13:13:23Z"),
     state: "WA", price: 13, quantity: 104 },
   { _id: 4, type: "strawberry", orderDate: new Date("2019-05-18T16:09:01Z"),
     state: "CA", price: 41, quantity: 162 },
   { _id: 5, type: "strawberry", orderDate: new Date("2019-01-08T06:12:03Z"),
     state: "WA", price: 43, quantity: 134 }
] )

下面的示例在 $setWindowFields 阶段使用 $stdDevPop 输出每个州蛋糕销售数量的人口标准差：

db.cakeSales.aggregate( [
   {
      $setWindowFields: {
         partitionBy: "$state",
         sortBy: { orderDate: 1 },
         output: {
            stdDevPopQuantityForState: {
               $stdDevPop: "$quantity",
               window: {
                  documents: [ "unbounded", "current" ]
               }
            }
         }
      }
   }
] )

在本例中：

partitionBy: "$state"按照州state对集合的文档进行分区，有CA和WA两个区。
sortBy: { orderDate: 1 }根据orderDate对分区内文档进行由小到大的排序，orderDate最早的排在第一个。
output使用$stdDevPop将窗口内文档的quantity标准差赋予stdDevPopQuantityForState字段。窗口包含无界下限和输出中的当前文档之间的文档，这意味着$stdDevPop返回分区开头和当前文档之间文档的数量总体标准差。

在此示例输出中，CA和WA 的quantity总体标准差放在stdDevPopQuantityForState字段：

操作结果如下：

{ _id : 4, type : "strawberry", orderDate : ISODate("2019-05-18T16:09:01Z"),
  state : "CA", price : 41, quantity : 162, stdDevPopQuantityForState : 0 }
{ _id : 0, type : "chocolate", orderDate : ISODate("2020-05-18T14:10:30Z"),
  state : "CA", price : 13, quantity : 120, stdDevPopQuantityForState : 21 }
{ _id : 2, type : "vanilla", orderDate : ISODate("2021-01-11T06:31:15Z"),
  state : "CA", price : 12, quantity : 145, stdDevPopQuantityForState : 17.249798710580816 }
{ _id : 5, type : "strawberry", orderDate : ISODate("2019-01-08T06:12:03Z"),
  state : "WA", price : 43, quantity : 134, stdDevPopQuantityForState : 0 }
{ _id : 3, type : "vanilla", orderDate : ISODate("2020-02-08T13:13:23Z"),
  state : "WA", price : 13, quantity : 104, stdDevPopQuantityForState : 15 }
{ _id : 1, type : "chocolate", orderDate : ISODate("2021-03-20T11:30:05Z"),
  state : "WA", price : 14, quantity : 140, stdDevPopQuantityForState : 15.748015748023622 }

原子星

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
MongoDB聚合运算符：$stdDevPop

摘要：`$stdDevPop`聚合运算符用来计算输入值的总体标准差。如果确认数据代表了整个数据集，且不希望对更大的群体进行归纳，可以使用`$stdDevPop`来计算总体标准差。如果数据仅代表了总体的一部分样本，但又想把结论推广到整个数据集，则应该使用`$stdDevSamp`。
复制链接

扫一扫