自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 2020-10-19

主要问题是在使用sqoop时的参数配置问题,当我们选用搜sqoop job 方式提交时,虽然在最后面按照官网提示配置了schema参数,但是sqoop job的解析并不能正确解析,到时候会报错Unrecognized argument: --schema . sqoop job -D mapreduce.job.queuename=root.default -D org.apache.sqoop.splitter.allow_text_splitter=true --create hub_data_ex

2020-10-19 17:31:44 212 1

原创 关于POJO类

一、引言DO、DTO、BO、AO、VO、POJO的概念看似简单,但是想区分好或者理解好也不容易,本文简单梳理一下。通过各层POJO的使用,有助于提高代码的可读性和可维护性。二、区别《阿里巴巴Java开发规范》关于领域模型的部分介绍如下:分层领域模型规约:DO(Data Object):此对象与数据库表结构一一对应,通过 DAO 层向上传输数据源对象。DTO(Data Transfer Object):数据传输对象,Service 或 Manager 向外传输的对象。BO(Business

2020-08-10 09:34:19 3208 1

原创 JAVA抽象类和抽象方法(abstract)

当父类的某些方法不确定时,可以用abstract关键字来修饰该方法[抽象方法],用abstract来修饰该类[抽象类]。我们都知道,父类是将子类所共同拥有的属性和方法进行抽取,这些属性和方法中,有的是已经明确实现了的,有的还无法确定,那么我们就可以将其定义成抽象,在后日子类进行重用,进行具体化。这样,抽象类也就诞生了。例如,定义了“动物”父类,其中“动物名称”和“动物年龄”属性已经明确了,但是“动物叫”的方法没有明确,此时就可以将“动物叫”定义为抽象方法。所以,抽象类是为了把相同的但不确定的东西的提取

2020-07-04 23:05:30 318

原创 Flink之统计PVUV

大数据开发最常统计的需求可能就是 PV、UV。PV 全拼 PageView,即页面访问量,用户每次对网站的访问均被记录,按照访问量进行累计,假如用户对同一页面访问了 5 次,那该页面的 PV 就应该加 5。UV 全拼为 UniqueVisitor,即独立访问用户数,访问该页面的一台电脑客户端为一个访客,假如用户对同一页面访问了 5 次,那么该页面的 UV 只应该加 1,因为 UV 计算的是去重后的用户数而不是访问次数。当然如果是按天统计,那么当天 0 点到 24 点相同的客户端只被计算一次,如果过了今天 2

2020-06-27 10:54:24 1164 1

原创 Java获取随机数的应用

一、理解Math.random()随机数系统默认该随机数范围0-1之间的double值,注意:这里的区间是[0,1)//也就是你取不到1所以如果你在这里使用(int)Math.random() 只能得到一个数字0二、扩大随机数取值范围例:获取[50,100)之间的随机整数int i=(int)(Math.random()*50+50);//Math.random()只能获取0-1之间的double值,所以首先要获取0-50之间的随机数,所以*50,然后+50,随机数区间就会变为 [50,100)

2020-06-27 10:45:12 247

转载 Java创建删除Topic

1.pom<dependency>      <groupId>org.apache.kafka</groupId>      <artifactId>kafka_2.10</artifactId>      <version>0.10.2.1</version>    </dependency>    <dependency>      <groupId>org.apache

2020-06-24 22:48:54 515

原创 Kafka工具类

今天在使用的Kafka的时候,发现新版的Kafka中的ZKUtils方法显示已过时,查阅了资料发现ZKUtils方法已经被AdminClient替代了。官网上关于AdminClient的介绍是:The AdminClient API supports managing and inspecting topics, brokers, acls, and other Kafka objects.,详情可参见官网文档。主要功能包括:创建Topic:createTopics(Collection newTop

2020-06-24 22:41:07 343

原创 Flink源码阅读之Flink_Core_Memory

Flink源码阅读----04源码分析1.MemorySegmentHeapMemorySegment和HybridMemorySegment都是MemorySegment类的子类HeapMemorySegment表示此类表示由Flink管理的堆内存。该段由字节数组支持,并具有针对基本类型的随机放置和获取方法,以及比较和交换方法。此类专门用于堆内存的字节访问和字节复制调用,同时重用Mem...

2020-03-25 10:00:12 290 1

原创 FLink学习之数据是怎么进来的

FLink学习002——数据是怎么进来的1.Flink世界观​ 在flink的世界观中一切都是由流组成的,离线数据是有界限的流,实时数据是一个没有界限的流,这就是所谓的有界流和无界流。无界数据流:无界数据流有一个开始但是没有结束,它们不会在生成时终止并提供数据,必须连续处理无界流,也就是说必须在获取后立即处理event。对于无界数据流我们无法等待所有数据都到达,因为输入是无界的,并且在任何时...

2020-03-14 20:05:05 431 1

原创 Flink学习之环境搭建,项目结构

1.Flink安装准备Flink 是一个以 Java 及 Scala 作为开发语言的开源大数据项目,代码开源在 GitHub 上,并使用 Maven 来编译和构建项目。对于大部分使用 Flink 的同学来说,Java、Maven 和 Git 这三个工具是必不可少的,另外一个强大的 IDE 有助于我们更快的阅读代码、开发新功能以及修复 Bug。因为篇幅所限,我们不会详述每个工具的安装细节,但会...

2020-03-14 17:19:58 1731 1

HBase表结构.jpg

HBase表结构.jpg

2020-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除