自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 自定义函数步骤:

在编辑工具中写好java代码继承UDF函数重载里面的evaluate方法,上传到linux,打成jar包(找到文件重命名),在hive中执行【add jar “路径”;命令】(添加到hive的环境变量),执行create temporary function 临时函数名 as 类全名,然后执行命令select 临时函数名(字段) from 表...

2020-10-19 20:59:59 248

原创 20道大数据常见面试题

1.Hadoop分布式集群与伪分布式集群的区别分布式集群需要多台电脑,,一台为奴隶主机,其他的为奴隶机用来存储数据。伪分布式集群可以使用一台电脑搭建,也可以使用多台电脑,只需要在slaves中添加自己的主机名就可以了,其他的与分布式一样。2.Hadoop分为三个核心部分,每个部分是什么,有什么功能?三个核心:hdfs,mapreduce和yarnHadfs:分布式文件系统,mapreduce:分布式计算框架,yarn:资源调度器功能:hdfs:由很多服务器联合起来实现其功能,集群中的

2020-10-19 20:56:59 1260 2

原创 hadoop相关面试题

MapTask并行机度是由什么决定的?由切片数量决定的。MR是干什么的?MR将用户编写的业务逻辑代码和自带的默认组件结合起来组成一个完整的分布式应用程序放到hadoop集群上运行。MR的实例进程:driver(mr的job提交客户端)MRAppMasterMapTaskReduceTaskcombiner和partition的作用:combiner的意义就是对每一个maptask的输出进行局部汇总,以减小网络传输量partition的默认实现是hashpartition,是map端将数

2020-10-19 20:54:44 243 1

原创 Java的几种设计模式

Java的几种设计模式java的设计模式大体上分为三大类:创建型模式(5种):工厂方法模式,抽象工厂模式,单例模式,建造者模式,原型模式。结构型模式(7种):适配器模式,装饰器模式,代理模式,外观模式,桥接模式,组合模式,享元模式。行为型模式(11种):策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设计模式...

2019-11-12 10:33:45 255

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除