- 博客(4)
- 收藏
- 关注
原创 Hadoop编写MapReduce程序计算超市销售数据月份销售总额
Hadoop分布式文件系统(HDFS)是Apache Hadoop生态系统的核心组件之一,用于存储和管理大规模数据集。它设计用于在廉价的硬件上运行,并且提供高可靠性、高性能的分布式存储解决方案。本文将深入探讨HDFS的工作原理、架构和优势。
2024-05-12 20:11:56
853
原创 Python数据分析依赖的两个对象
excel和python处理结构化数据的差异Excel和Python都是处理结构化数据的常用工具。Excel是一种电子表格软件,可以方便地进行数据输入、计算和分析。Python是一种编程语言,可以使用各种库和工具来处理和分析数据。本文将介绍Excel和Python处理结构化数据的差异,并提供一些示例代码来帮助你了解两者之间的区别。在Pandas库中,Series是一种类似于一维数组的数据结构,它由两个主要组成部分组成:索引(index)和值(values)。
2023-12-22 21:07:37
960
原创 网络爬虫-解析网页数据
通过对前面章节的学习,我们已经将整个静态网页的源代码全部抓取下来了,并且源代码包含了最终要提取的数据。这些数据分为非结构化数据和结构化数据两种。由于这两种数据各有各的特点,因此需要采用不同的技术进行解析,提取与目标有关的数据。本章将围绕着解析网页数据的相关知识进行详细讲解。XPath是一种用于在XML文档中定位和选择节点的语言。它使用路径表达式来描述节点的位置。XPath表达式可以基于节点的标签名称、属性、文本内容等来选择节点。XPath提供了一种简洁而强大的方式来解析和提取XML文档中的数据。
2023-12-22 19:32:57
1649
原创 java选择结构
当表达式的值与case后的常量表达式的值相等时,则执行该case后的语句序列。如果所有的case语句的常量表达式的值与switch之后的表达式不匹配,则执行default之后的语句序列。switch语句是一种在许多编程语言中常见的条件语句,它能根据一个表达式的值,将控制流转移到与该值匹配的不同分支。然后,程序会依次检查每个case语句,如果某个case的值与表达式的值匹配,那么执行对应的代码块。if分支语句可以根据不同的条件来执行不同的代码,这使得程序可以根据不同的情况做出不同的响应。
2023-12-17 18:53:20
1033
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人