- 博客(6)
- 收藏
- 关注
原创 数据清洗:Python 中的魔法与挑战
在数据分析和处理的领域中,数据清洗是至关重要的一步。它就像是为珍贵的宝石进行打磨,去除杂质,展现出数据真正的光芒。而 Python ,凭借其丰富的库和强大的功能,成为了数据清洗的得力工具。在现实世界中,收集到的数据往往并不完美。可能存在缺失值、重复数据、错误的数据类型、异常值等等。这些问题如果不加以处理,会严重影响后续的分析和建模结果。例如,在一个销售数据集中,如果存在部分产品的价格记录为负数,那么基于这样的数据得出的销售趋势分析必然是不准确的。
2024-07-01 22:41:26 1553
原创 Java语言程序设计
初识Java初识JavaJava提供了一个强大语言的所有功能,并且几乎没有一点含混特征。C++的安全性不高,但C和C++有着大量用户,因此,Java被设计成与C++相似的形式,以便我们学习。Java语言很精炼。Java程序的工作机制Java语言的核心设计理念是跨平台和安全性,为此,Java发展了Java虚拟机、Java字节码和垃圾自动回收机制三大核心技术。上图是 Java程序的运行过程。从图中可以看出,在服务器端,首先由开发人员编写Java源程序并存储编译时为.java文件;
2024-06-24 01:50:04 1522
原创 MongoDB分片部署(Windows)
分片技术是开发人员用来提高数据存储和数据读写吞吐量常用的技术之一。简单的来说,分片主要是将数据进行划分后,将它们分别存放于不同机器上的过程。通过使用分片可以实现降低单个机器的压力和处理更大的数据负载功能。分片与副本集主要区别在于,分片是每个节点存储数据的不同片段,而副本集是每个节点存储数据的相同副本。
2024-06-18 11:06:13 1673
原创 MongoDB副本集部署(Windows)
MongoDB副本集介绍:MongoDB的副本集是一组维护相同数据集的MongoDB服务器,提供高可用性和数据冗余。副本集有一个主节点(primary)和多个从节点(secondary),当主节点出现故障时,从节点可以通过选举一个新的主节点来保持服务的高可用性。
2024-06-03 22:16:57 285 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人