大数据
苦青藤
这个作者很懒,什么都没留下…
展开
-
浅谈一下workstation
浅谈一下workstationworkstation:中文名称就是计算机工作站,简称工作站,是一种高端通用的微型计算机,它是为了单用户使用并提供比PC更加强大的性能,尤其是在图形,处理能力,任务并行的能力以上就是搜狗问问的回答讲真的看完词条我觉的并没有理解到真实的意思所以我又去找了百度百度百科,查到的意思大同小异,但是多了一句话连接到服务器的终端机也可以称之为工作站,然后我就有了一种想法workstation:就是计算机工作站,也就是连接到服务器的pc机就具有了远超原本自带的运算能力,以及存原创 2020-11-03 20:25:11 · 784 阅读 · 0 评论 -
scala学习笔记(1)
scala1.简介:Scala是一门类Java的编程语言,它结合; 面向对象编程和函数式编程。scala是纯面向对象的语言,每一个值都是对象,对象的类型和行为由类来定义,不同的类可以通过混入的方式组合在一起。scala被设计用来和Java无缝互操作,scala类可以调用Java方法,创建Java类的对象,继承Java类和实现Java接口2.标识符有三种方法可以构造一个标识符:第一...原创 2020-01-17 18:04:29 · 334 阅读 · 0 评论 -
大数据杂记
mr的继承类1.map extends Mapper2.reduce extends Reduce3.bean implements WriteableComparable4.groupConmparator extends WriteableComparator5.softComparator extends WriteableComparator6.partitioner exte...原创 2019-12-25 19:42:40 · 112 阅读 · 0 评论 -
spark主要核心笔记
spark主要用来做数据的分析,必须要把分析的数据存放到rdd-----------弹性分布式数据集弹性:可以随着work的变化而变化分布式:同一个数据集在多台服务器中存放,每一台服务器只存放整个rdd的一部分,一般都是平均分配rdd:就是一个集合/数组,这样来理解:看成一个数据库数据集:数据的集合,很多很多的数据rdd中有许多的分区,相当于数据库的表----数据存放在rdd的分区中r...原创 2019-12-25 19:38:22 · 152 阅读 · 0 评论 -
MapReduce著名案例之天气TOP-N
天气mapreduce的案例TQ封装的类package TQ;import org.apache.hadoop.io.WritableComparable;import org.apache.hadoop.io.WritableComparator;import java.io.DataInput;import java.io.DataOutput;import java.io.IO...原创 2019-12-25 19:23:11 · 508 阅读 · 3 评论