自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杂记

专注

  • 博客(32)
  • 资源 (11)
  • 收藏
  • 关注

翻译 走进 Iceberg Java API 系列 1- Catalog

随着Iceberg集成到越来越多的计算引擎中,有各种提供了强大功能的接口可以供你使用。本系列将介绍在没有引擎的情况下使用冰山表的底层Java API,而本文是本系列的第一篇。

2022-06-30 12:22:42 2246 2

原创 【随手记】scala 模式匹配-List

匹配数组的值 val atest: List[Int] = 1 :: List(2, 3, 4) println(atest) atest match { case header :+ a :+ b => println(header) println(a) println(b) case _ => println("Fail!") }//result List(1, 2, 3, 4)List(1, 2)

2022-04-25 10:24:40 637

原创 scala self =>自身类型简单介绍

介绍scala自身类型及self=>常见用法

2022-04-22 10:28:43 715

原创 Iceberg系列-API模块-Table相关概述-1

  Iceberg 作为一个开放的 table format,从设计之初就有一个高度抽象的良好框架。本节将带领大家领略 Iceberg API 模块下与表相关的内容,主要涉及表的设计、分区规范、快照管理等,但本节将只讲接口设计相关,具体 Iceberg 对相关部分的核心具体实现,后述再详述。  进入正题,本次既然是讲与表相关的设计,那么我们肯定要从一等公民 Table 开始。Table在Iceberg中,Table 是顶层的核心概念之一,为了更好的理解它,我们首先将这个接口的方法分类列出,读者可以不必

2022-03-21 16:43:04 1466

翻译 Iceberg顶层设计-FileIO:云原生表

在过去的几个月里,我们被问到很多关于 Iceberg FileIO 的问题,比如“它是否支持 Azure 或 Google Cloud?” 或“为什么不使用 Hadoop 中的 S3AFileSystem?”。基于这些对话,关于 FileIO 是什么以及它在各种存储提供者和处理引擎中扮演的角色,似乎存在相当多的困惑。这是一个绝佳的机会,可以更深入研究 Iceberg 的内部设计,并阐明它和传统方式在与存储层连接方面有何不同。...

2022-03-21 14:08:30 621

翻译 Docker、Spark 和 Iceberg:体验 Iceberg 的最快方式

如果您因为听说Iceberg解决了若干问题,例如模式演变或行级更新,而对Iceberg感兴趣,并且你想要一种简单的方法来体验它,那么您来对地方了!这篇文章将让您在本地几分钟内启动并运行 Spark 和 Iceberg。同时将展示出许多令人惊叹的 Iceberg 特性,这些特性可以解决您以前使用数据仓库时遇到的问题。

2022-02-24 19:33:36 1557

翻译 Apache Iceberg 0.13 特性介绍-Flink/Spark新版本支持、增量删除等特性来袭

Apache Iceberg 社区刚刚发布了 0.13 版,其中有很多很棒的新增功能!在这篇文章中,我将介绍一些本版本的亮点功能。

2022-02-23 15:52:06 1054

原创 iceberg系列:源码- BinPacking 解读

在Iceberg中,有一个名为BinPacking的类,这个类在manifest文件和规划切分时使用频繁。我们这一章来解读此类。

2022-02-21 17:33:05 1199

原创 iceberg系列(1):存储详解-初探2

Iceberg是数据湖热门组件之一,本系列文章将深入探究一二。首先将研究iceberg底层存储。

2022-02-17 10:12:08 602

原创 iceberg系列(1):存储详解-初探1

Iceberg是数据湖热门组件之一,本系列文章将深入探究一二。首先将研究iceberg底层存储。

2022-02-17 10:11:25 1862

原创 iceberg系列(2):存储详解-partition-2

iceberg分区演化 可以通过添加、删除、重命名或重新排序分区规范字段来改进表分区。

2022-02-17 10:07:48 1437

原创 iceberg系列(2):存储详解-partition-1

iceberg分区演化可以通过添加、删除、重命名或重新排序分区规范字段来改进表分区。

2022-02-17 10:06:33 928

原创 iceberg 源码编译

iceberg源码编译

2021-08-13 00:17:34 2329

原创 使用Docker创建Kerberos认证中心

使用Docker创建Kerberos认证中心使用Docker创建Kerberos认证中心1、构建KDC中心2、创建Kerberos客户端client使用Docker创建Kerberos认证中心使用Docker构建Kerberos KDC中心以及客户端。1、构建KDC中心我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:FROM centos:7RUN yum install -y krb5-server

2021-02-28 21:09:42 2079 1

原创 Spark分布式内存及存储管理机制浅析

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎同,它最初是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架。Spark拥有Hadoop MapReduce所具有的优点,但不同于MapReduce的是其中间输出结果更倾向于保存在内存中,从而不再需要读写HDFS,因此Spark的计算效率得...

2019-11-18 19:19:17 898

原创 centos7 yarn启用CGroups

在centos7,cgroup中的cpu和cpuacct被预先挂载到了/sys/fs/cgroup/cpu,cpuacct,因为中间有,号,所以在NM启动的时候,会报错,所以需要先把这个挂载取消掉。#umount原来默认路径umount /sys/fs/cgroup/cpu,cpuacct#创建新的cpu控制器mount路径,这个路径,取决于yarn.nodemanager.lin...

2019-08-21 09:53:45 1737

原创 WebLogic Server 12cR2 Linux静默安装

mkdir -p /home/weblogicInstallcd /home/weblogicInstall新建文件:wls.rspvim wls.rsp内容如下:[ENGINE]Response File Version=1.0.0.0.0[GENERIC]#set oracle dirORACLE_HOME=/home/weblogic/Oracle/Middleware...

2019-08-08 16:46:01 305

原创 PD虚拟机(win10)共享网络给主机mac使用

因办公需要,有线网络使用pd虚拟机(win10)连接,然后共享给mac主机使用,记录一下过程,另给大家参考。软硬件:首先,在PD->偏好设置->网络 点击左下角+号,添加一个Host-Only #2 网络,进行如下设置(一定要勾选在系统偏好设置中显示):此时进入mac网络偏好设置,会发现多出一个虚拟网络,将pd虚拟出的网络设置为如图所示:将mac连接...

2018-01-15 13:05:42 23661 30

原创 使用Spring Boot操作Hive JDBC时,启动时报出错误:NoSuchMethodError: org.eclipse.jetty.servlet.ServletMapping.setDef

使用Spring Boot操作Hive JDBC时,启动时报出错误:NoSuchMethodError: org.eclipse.jetty.servlet.ServletMapping.setDefault(Z)Vorg.springframework.context.ApplicationContextException: Unable to start embedded cont

2017-10-30 16:51:47 7805

原创 不进hbase shell,直接使用Hbase命令创建预分区表

hbase org.apache.hadoop.hbase.util.RegionSplitter test_table1 HexStringSplit -c 100 -f info-c 是指将预分为多少个region-f family名字

2017-04-26 16:00:33 1590

原创 kafka topic增加partition

通过kafka-topics.sh 的alter选项 ,将topic1的partitions从1增加到6; ./kafka-topics.sh --alter --topic topic1 --zookeeper zkip:2181/kafka --partitions 6

2017-02-15 17:34:15 17494 1

转载 hbase 修复 hbase hbck

hbase hbck新版本的 hbck 可以修复各种错误,修复选项是: (1)-fix,向下兼容用,被-fixAssignments替代 (2)-fixAssignments,用于修复region assignments错误 (3)-fixMeta,用于修复meta表的问题,前提是HDFS上面的region info信息有并且正确。 (4)-fixHdfsHoles,修

2016-12-14 14:40:18 18184

原创 Spark SQL 实现 group_concat

Spark SQL 实现 group_concat环境:Spark 2.0.1 以下貌似需要至少Spark 1.6支持,未实测表结构及内容:+-------+---+| name|age|+-------+---+|Michael| 29|| Andy| 30|| Justin| 19|| Justin| 20|| LI| 20|+----

2016-10-14 10:21:35 13144 2

原创 CDH 5.7.0 Hive使用Mysql作为元数据库,报unable to find the jdbc database jar on host

将mysql-connector-java-5.1.34-bin.jar拷贝至以下目录:/opt/cm-5.7.0/share/cmf/lib/ 如不起作用,将mysql-connector-java-5.1.34-bin.jar放入/usr/share/java/(如不存在则创建),并重命名为:mysql-connector-java.jar

2016-10-08 14:16:25 5550 1

原创 HBase shell 使用SingleColumnValueFilter

HBase shell 使用SingleColumnValueFilter

2016-07-13 10:50:58 3929 1

原创 hive UDF使用本地文件资源

a、未注册用本地地址,e.g. String filepath = "/data/aaa.txt";b、注册至hive后用相对地址,e.g.String filepath = "./aaa.txt";注:hive中注册 add jar [jar file path] or add file [file path]

2015-09-11 12:03:20 2580

原创 JAVA端通过Oozie Client 启动Oozie任务

oozie虽然内置了条件触发,但有时当我们的触发条件比较复杂的时候,可以使用java程序来控制其运行,而oozie同样提供了client端供使用。通过OozieClient 端设置confWorkflow.xml指定任务内所需配置文件等信息,如hive的配置文件等。需要注意必须指定user.name,否则将导致权限错误,使程序一直处于Hold状态。1、JAVA端调用

2015-09-07 16:39:56 7450

原创 Oozie配合Hive、Sqoop定时导出Hive表数据至RDB

Oozie配合Hive、Sqoop完成定时导出Hive表数据至RDB一、整体流程 Oozie定时启动Hive程序,将Hive表数据根据需求导出至HDFS,而后启动Sqoop,将HDFS数据导入至RDB目标表。二、HQL数据导出语句(需根据具体需求再行修改) 略过三、Sqoop导入数据至RDBsqoop export --connect jdbc:mysql://mo

2015-09-07 16:37:31 2704

转载 Oozie工作流程定义详解

Oozie工作流程定义是一个DAG(Directed Acyclical Graphs)图,它由控制流节点(Control Flow Nodes)或动作节点(Action Nodes)组成,各个节点又是通过表征转移的箭线(transitionsarrows)互相连通。对于工作流一般对应存在流程定义语言,例如jBPM是jPDL,大多数都是基于XML定义的,Oozie流程定义语言也是基于XML定义

2015-09-07 15:56:56 907

转载 Oozie Coordinator使用及详解

Oozie所支持工作流,工作流定义通过将多个Hadoop Job的定义按照一定的顺序组织起来,然后作为一个整体按照既定的路径运行。一个工作流已经定义了,通过启动该工作流Job,就会执行该工作流中包含的多个Hadoop Job,直到完成,这就是工作流Job的生命周期。那么,现在我们有一个工作流Job,希望每天半夜00:00启动运行,我们能够想到的就是通过写一个定时脚本来调度程序运行。如果我们有多

2015-09-07 15:51:58 912

原创 64位Red Hat 6.5 修改yum源

本节以64位 Red Hat Enterprise Linux Server release 6.5 (Santiago)为版本,其它版本修改相应的版本号与位数即可。 --删除redhat原有的yum rpm -aq|grep yum|xargs rpm -e --nodeps  下载yum安装文件(版本号可修改,但需要进去软件目录寻找相对应的版本)

2014-10-31 16:39:43 759

原创 hadoop、hbase、zookeeper整合kerberos,搭建安全平台

随着Hadoop等大数据技术的普及,其平台的安全性日益受到企业的重视,特别是对安全性要求较高的通信、金融等领域。而安全性主要包括两个部分:Authentication、Authorization。本文侧重于Authentication方面,旨在通用整合Kerberos,提升大数据平台的安全性,降低风险。至于Authorization方面内容,另有篇幅描述。

2014-10-31 16:15:19 6327 1

db2forAS400驱动.zip

db2forAS400驱动

2019-11-18

IT项目实施方案模板.ppt

IT项目实施方案模板

2019-11-18

android可编辑计算器

android可编辑计算器,挺不错的,大家可以直接使用。

2012-06-12

软件设计规格说明书

软件设计规格说明书,大家有需要可以看看软件设计规格说明书,大家有需要可以看看

2011-12-31

eclipse_3.7_中文包_eclipse_汉化包_eclipse_最新最全汉化包

eclipse_3.7_中文包_eclipse_汉化包_eclipse_最新最全汉化包

2011-12-26

JavaEE+3GAndroid学习路线图

JavaEE+3GAndroid学习路线图

2011-12-26

进程调度模拟实验+操作系统+课程设计

进程调度模拟实验 操作系统 课程设计 java

2011-12-26

用JAVA模拟生产者与消费者的实例

用JAVA模拟生产者与消费者的实例,java 生产者 消费者 操作系统

2011-12-26

JDK 7.0 api en 文档

JDK7.0的API文档。 从网上找到的JDK7.0API英文文档,暂时没有找到中文版的,不过这个英文版也可满足要求了。

2011-11-03

JDK1.5 api 文挡

此文档来源于 java.sun.com, 其中Java API文档中文版来源于 http://gceclub.sun.com.cn/. 我们会随着官方最新的版本更新而更新. 您可以访问 Jet Mah 或 Franck Allimant 的站点来免费下载更多的WinHelp和HTMLHelp格式的Java文档.

2011-11-03

JAVA帮助文档全系列_JDK1.5_、JDK1.6、_JDK1.7_官方中英完整版下载

各个版本的JDK下载地址 JAVA帮助文档全系列 JDK1.5 JDK1.6 JDK1.7 官方中英完整版下载 JDK(Java Development Kit,Java开发包,Java开发工具)是一个写Java的applet和应用程序的程序开发环境。它由一个处于操作系统层之上的运行环境还有开发者编译,调试和运行用Java语言写的applet和应用程序所需的工具组成。 JDK(Java Development Kit)是Sun Microsystems针对Java开发员的产品。自从Java推出以来,JDK已经成为使用最广泛的Java SDK(Software development kit)。 JDK包含的基本组件包括: ·javac – 编译器,将源程序转成字节码 ·jar – 打包工具,将相关的类文件打包成一个文件 ·javadoc – 文档生成器,从源码注释中提取文档 ·jdb – debugger,查错工具 JDK中还包括完整的JRE(Java Runtime Environment,Java运行环境),也被称为private runtime。包括了用于产品环境的各种库类,以及给开发员使用的补充库,如国际化的库、IDL库。 JDK中还包括各种例子程序,用以展示Java API中的各部分。 JDK 官方下载

2011-11-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除