- 博客(4)
- 收藏
- 关注
原创 使用Hadoop MapReduce计算成绩平均值
Hadoop MapReduce是一个分布式计算框架,常用于处理大规模数据集。本篇博客将介绍如何使用Hadoop MapReduce计算学生科目成绩的平均值。我们将通过编写Map和Reduce两个类来实现这个功能。通过以上步骤,我们成功编写了一个使用Hadoop MapReduce计算各科目成绩平均值的程序,并将打印结果输出到hdfs路径中。通过这种方式,我们可以方便地处理大规模的科目成绩数据,并计算出平均值。希望本篇博客对小伙伴们有所帮助!如果有任何问题或建议,请随时提出。
2024-05-17 16:48:52 2083
原创 豆瓣电影数据爬取实战
项目目标:从豆瓣电影网站上爬取正在热映电影的相关信息:(网址:https://movie.douban.com/cinema/nowplaying/liuzhou/),这里我以柳州为例子,包括电影名字、演员、类型、语言、上映日期和简介,并且存储到mongodb数据库中技术栈:依赖 requests 库发送 HTTP 请求,logging 库记录日志信息,re 库进行正则表达式匹配。
2023-12-26 20:00:05 357 1
原创 Python 数据可视化之制作时间轴人口条形图形
定义一个 JavaScript 函数 color_func,用于根据参数 params 的 name 属性返回对应国家的颜色'''
2023-12-25 11:28:56 615
原创 Java安装
学习Java之前,我们需要学会如何配置Java环境和安装Java编辑工具,软件下载包如下:链接:https://pan.baidu.com/s/1Bo8e1QSfJN7K0z8eXVqTCg提取码:1109在Java学习中,我们常用jdk1.8版本,其实也可以使用jdk17版本,二者的环境配置一摸一样,下面的操作中我以win11为例。
2023-11-09 22:05:26 85
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人