- 博客(4)
- 收藏
- 关注
原创 使用 Apache Spark 分析 HDFS 数据,并输出销售额最高的前三个商品及其销售额。
Spark是一个开源的大数据处理框架,由Apache软件基金会开发和维护。它提供了高速、通用的数据处理能力,能够在分布式环境中处理大规模数据集。Spark支持多种编程语言,如Scala、Java、Python和R,并提供了丰富的API供开发者使用。它可以以批处理或流处理的方式对数据进行分析、处理和计算,并具备分布式机器学习和图处理的能力。通过内存计算和弹性计算资源的利用,Spark能够实现高效的数据处理和快速的计算速度,已经成为大数据领域的重要工具之一。
2023-11-21 22:44:49 313
原创 银行业务管理系统
1.设备:属性至少3个以上,包括并不限于设备类型、设备名称、初始状态……2.添加设备3.删除设备4.更新设备5.查找设备(名字),显示查询结果。6.分页查询7.排序在写代码地时候记得看仔细,看方法有没有被调用,我中间就出现过这样的错误,导致一直没运行成功。
2023-07-04 14:48:13 458
原创 Hbase集群部署
使用catjps查看所有集群的进程,看到QuorumPeerMain进程表示启动成功了。因为在此之前我已经安装过zookeeper了,所以这里不做操作,需要的自己去百度。切换路径:cd /usr/local/hbase-2.5.4/conf/先切换到/usr/local 目录下,随后使用启动zookeeper。需要切换到/usr/loca路径下,如果已经在此路径下就不需要切换了。在此之前先切换到/usr/local路径下。需要先切换到/usr/local路径下。用ll查看有没有配置好的hbase文件。
2023-06-26 22:02:25 846
原创 数据可视化—画基于雷达图的时间轴组件图形。
这是我学习数据可视化的内容之一,可能这篇文章呈现的内容也并不好,自己还有很多不足之处,但希望自己未来可以做得更好。
2023-06-09 22:10:46 722 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人