mongoDB大数据——mongodb简介

最新推荐文章于 2024-01-28 14:32:26 发布

LSY_csdn_

最新推荐文章于 2024-01-28 14:32:26 发布

阅读量656

点赞数

分类专栏： mongodb MongoDB大数据文章标签： mongodb

本文链接：https://blog.csdn.net/LSY_CSDN_/article/details/96432603

版权

15 篇文章 0 订阅

订阅专栏

15 篇文章 0 订阅

订阅专栏

一、Mongodb简单介绍：

MongoDB 是一个基于分布式文件存储的数据库。在高负载的情况下，添加更多的节点，可以保证服务器性能。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。

MongoDB 是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。

MongoDB 将数据存储为一个文档，数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档，数组及文档数组。

在传统的关系型数据库中，存储方式是以表的形式存放，而在MongoDB中，以文档的形式存在。

SQL Terms/Concepts	MongoDB Terms/Concepts
database	database
table	collection
row	document or BSON document
column	field
index	index
table joins	embedded documents and linking
primary key Specify any unique column or column combination as primary key.	primary key In MongoDB, the primary key is automatically set to the _id field.
aggregation (e.g. group by)	aggregation pipeline See the SQL to Aggregation Mapping Chart.

网站数据、缓存等大尺寸、低价值的数据。在高伸缩性的场景，用于对象及JSON数据的存储。

在上面的表格中进行选择，但有1个yes的时候：可以考虑MongoDB；当有2个以上yes的时候：不会后悔的选择！

慎用场景	原因
PB 数据持久存储大数据分析数据湖	Hadoop、Spark提供更多分析运算功能和工具，并行计算能力更强 MongoDB + Hadoop/Spark
搜索场景：文档有几十个字段，需要按照任意字段搜索并排序限制等	不建索引查询太慢，索引太多影响写入及更新操作，elasticsearch拥有很强的全文搜索能力，并且可集群、高可用。
ERP、CRM或者类似复杂应用，几十上百个对象互相关联	关联支持较弱，事务较弱
需要参与远程事务，或者需要跨表，跨文档原子性更新的	MongoDB 事务支持仅限于本机的单文档事务
100% 写可用：任何时间写入不能停	MongoDB换主节点时候会有短暂的不可写设计所限