![](https://img-blog.csdnimg.cn/c148123cb8d34a389d1740a9e58e0ffc.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据管理与分析实验
文章平均质量分 91
基于指导书的大数据实验,主要是补充了代码注释,个人实验体会和所遇到的问题及问题解决。
啦啦右一
好好学习,身心健康~o(〃^▽^〃)o
展开
-
大数据 | 实验零:安装 Hadoop 伪分布式系统
实验零:安装 Hadoop 伪分布式系统原创 2023-03-12 20:55:41 · 2111 阅读 · 2 评论 -
大数据 | 实验一:大数据系统基本实验 | 常用的 Linux 操作和 Hadoop 操作
Hadoop 运行在 Linux 系统上,因此需要学习实践一些常用的 Linux 命令。原创 2023-03-12 23:38:00 · 5261 阅读 · 1 评论 -
大数据 | 实验一:大数据系统基本实验 | 熟悉常用的HDFS操作
1)理解 HDFS 在 Hadoop 体系结构中的角色。2)熟练使用 HDFS 操作常用的 shell 命令。3)熟悉 HDFS 操作常用的 Java API。原创 2023-04-09 21:00:37 · 7443 阅读 · 1 评论 -
大数据 | 实验一:大数据系统基本实验 | MapReduce 初级编程
掌握用 MapReduce 解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。通过实验掌握基本的 MapReduce 编程方法。原创 2023-04-10 08:00:00 · 1995 阅读 · 0 评论 -
大数据 | 实验一:大数据系统基本实验 | 熟悉常用的HBase操作
1)理解 HBase 在 Hadoop 体系结构中的角色。2)熟练使用 HBase 操作常用的 shell 命令。3)熟悉 HBase 操作常用的 Java API。原创 2023-04-20 08:00:00 · 2134 阅读 · 1 评论 -
大数据 | 实验二:文档倒排索引算法实现
倒排索引(Inverted Index)被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射,是目前几乎所有支持全文索引的搜索引擎都需要依赖的一个数据结构。原创 2023-04-26 07:15:00 · 2209 阅读 · 1 评论 -
大数据|实验三:PageRank算法实现
PageRank是一种在搜索引擎中根据网页之间相互的链接关系计算网页排名的技术。原创 2023-05-09 08:00:00 · 2548 阅读 · 5 评论 -
大数据 | 实验四:并行化数据挖掘算法设计
k近邻法(k-nearest neighbor,k-NN)是一种基本的分类和回归方法,是监督学习方法里的一种常用方法。原创 2023-05-26 07:00:00 · 1344 阅读 · 1 评论