大数据
文章平均质量分 87
这个时代少不了分布式计算与存储技术
程序猿一帆
机器学习研究僧
站在全职高手起点的男人
专攻python与机器学习
公众号:机器学习算法工程师
展开
-
林子雨—大数据技术原理与应用—上机实验二
题目:熟悉常用的HDFS操作 实验环境: 操作系统:ubuntu16.04 hadoop版本:1.2.1 JDK版本:1.8 Eclipse 3.8 实验内容:1.利用Hadoop提供的Shell命令完成下列任务。 (1) 向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原原创 2017-04-11 16:54:46 · 38477 阅读 · 7 评论 -
林子雨—大数据技术原理与应用—上机实验四
题目:NoSQL和关系数据库的操作比较 实验环境: 操作系统:ubuntu16.04 hadoop版本:1.2.1 JDK版本:1.8 Eclipse 3.8 Redis版本: 3.0.6 MongoDB版本: 2.6.0 实验内容:1.Redis数据库操作 1. 根据上面给出的键值对,用Redis的哈希结构设原创 2017-04-12 19:18:42 · 12007 阅读 · 0 评论 -
林子雨—大数据技术原理与应用—上机实验三
题目:熟悉常用的HBase操作 实验环境: 操作系统:ubuntu16.04 hadoop版本:1.2.1 JDK版本:1.8 Eclipse 3.8 HBase 0.98.24 实验内容:1. 用Hadoop提供的HBase Shell命令完成下列任务: (1) 列出HBase所有的表的相关信息,例如表名;原创 2017-04-12 10:29:35 · 27915 阅读 · 3 评论 -
林子雨—大数据技术原理与应用—上机实验五
题目:MapReduce编程初级实践 实验环境: 操作系统:ubuntu16.04 hadoop版本:1.2.1(伪分布式) JDK版本:1.8 Eclipse 3.8 解题思路:1. 编程实现文件合并和去重操作。 【注释】数据去重的最终目标是让原始数据中出现次数超过一次的数据在输出文件中只出现一次。由于shuffle过程会有合并相同k原创 2017-04-12 20:17:43 · 24717 阅读 · 6 评论 -
林子雨—大数据技术原理与引用—上机实验一
题目:熟悉常用的Linux操作和Hadoop操作原创 2017-04-07 00:20:24 · 17600 阅读 · 0 评论