- 博客(5)
- 收藏
- 关注
原创 使用pandas进行数据预处理
Pandas是一个强大的Python数据处理库,提供了快速、灵活和富有表现力的数据结构,旨在使得“关系”或“标记”数据的操作既简单又直观。
2024-05-07 21:29:11
1166
原创 MongoDB副本集、分片综合应用
MongoDB 副部集(Secondary Replica Set)和分片(Sharding)技术是 MongoDB 中的两个重要功能,它们提供了高可用性、数据冗余和可扩展性。副部集技术用于实现数据冗余和故障转移,确保在出现故障时,系统能够继续正常运行。分片技术则用于实现数据水平拆分,提高系统的性能和可扩展性。
2024-04-23 23:24:15
897
原创 mongodb基本操作
MongoDB数据库提供了多样性的索引支持,因此可以提高查询集合中文档的效率。若是没有索引,MongoDB数据库必须执行全集合扫描(即扫描集合中的每一个文档),从而筛选出与查询条件相匹配的文档。这种扫描全集合的查询效率是非常低的,尤其是在处理海量数据时,执行查询操作需要花费几十秒甚至几分钟的时间,这无疑对网站的性能是非常致命的。若是执行查询操作时,集合中的文档存在适当的索引,MongoDB就可以使用该索引限制必须检查的文档数量。索引是一种特殊的数据结构,即采用B-Tree数据结构。
2024-04-20 18:31:15
1410
2
原创 mongodb教程11 分片
分片(Sharding)技术是开发人员用来提高数据存储和数据读写吞吐量常用的技术之一。简单的来说,分片主要是将数据进行划分后,将它们分别存放于不同机器上的过程。通过使用分片可以实现降低单个机器的压力和处理更大的数据负载功能。分片与副本集主要区别在于,分片是每个节点存储数据的不同片段,而副本集是每个节点存储数据的相同副本。所有数据库都可以进行手动分片(Manual Sharding),因此,分片并不是MongoDB特有的。
2024-04-16 17:00:29
920
原创 mongodb副本集群
首先登陆到主节点mongo 127.0.0.1:27017,因为只能在主节点上操作。其中第一个“id”为复制集的ID标识,即"id":“rs0”;第二个“id”是复制集内成员的标识,即"id":0。还有一种初始化的方法,就是先只初始化一个节点,然后再通过命令rs.add("ip:port") 来添加从节点或。在主节点(127.0.0.1:27017)上的test库collection集合c1中插入数据。通过命令rs.addArb("ip:port")来添加投票节点。是分别运行的MongoDB实例的端口。
2024-04-09 16:47:01
544
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人