- 博客(2)
- 收藏
- 关注
原创 2021-06-10
1、需求描述 在如今互联网飞速发展的时代,许多地方都需要运用大数据的技术。大数据,IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology数据
2021-06-10 22:43:47
362
2
原创 大数据
调用MapReduce执行WordCount对单词进行计数 1.准备工作 首先,准备一个不少于10000万单词的文本文件,内容不限,可从各大英语文献网下载,将这个文件放置于hadoop文件夹中,以便实验。 图中 hh.txt 为实验文件 接着,将实验的文本文件上传到HDFS中(请确保Hadoop为开启状态) ./bin/hdfs dfs -put /usr/local/hadoop/demo.txt input 操作完成后调用ls命令查看文件上传情况 ./bin/hdfs dfs –ls input 上
2020-12-22 22:56:08
186
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人