大数据
FRESHET
这个作者很懒,什么都没留下…
展开
-
大数据之HADOOP计算学生平均成绩
本站数据集:https://download.csdn.net/download/FRESHET/126496641.MAPPER类import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;publ原创 2020-07-22 10:32:11 · 2118 阅读 · 0 评论 -
大数据之HADOOP癌证数据筛选
本站数据集:https://download.csdn.net/download/FRESHET/12649563类似这样的数据:主要是最后的阈值不太懂,这里就按小于-5来提示风险1.MAPPER类import java.io.IOException;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;public class CancerCntMapper extends Map原创 2020-07-22 10:10:07 · 335 阅读 · 0 评论 -
大数据之HADOOP之WORDCOUNT
这里分了三个类,看得清楚:1.mapper类import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;public class WordCountMapper extends Mapper<O原创 2020-07-22 09:56:27 · 249 阅读 · 0 评论 -
大数据之HADOOP跑通(WINDOWS下用ECLIPSE插件远程调用LINUX下HADOOP)
HADOOP环境变量配置见上篇WINDOWS下安装ECLIPSE(最好还是在LINUX下,自己是虚拟机崩了还这么弄的)HADOOP插件,放到dropings要plugins里都有说,我是放dropings里了,麻烦的是还得用dll,不推荐的原因之一。可以到本站下载,都是测试没问题放上去的。另一个是再复制一次hadoop.dll放到C\WINDOWS\SYSTEM32\里目的是在ECLIPSE里可视化生成map/reduce项目有的话证明插件生效,下一步进行配置首先在LIN原创 2020-07-21 17:31:24 · 184 阅读 · 0 评论 -
大数据之环境搭建
看到JAVA已经14了,1.4到14一个小数点十几年啊,这个得单独开一篇。现在升级太快,机器有点跟不上了,刚试了全新的装备机器蹦了,于是配置以下清单:1.virtualbox在https://www.onlinedown.net/soft/82464.htm下载,华军又情怀了。2.安装略3.下载linux境像http://www.linuxdown.net/Ubuntu/2016/0219/4767.html这里下载14,几乎是最小最新最全的可用版本4.配置一下虚拟机,这里说一下win7原创 2020-07-21 17:06:43 · 292 阅读 · 0 评论