自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (1)
  • 收藏
  • 关注

原创 idea打包的jar 运行时报 jar中没有主清单属性

在pom文件加上主程序入口的信息,即使pom文件飘红也没事,黄色字体为需要修改的主程序的类,完整的pom文件为:<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http..

2021-12-14 13:54:27 372 1

原创 idea maven 报错jar中没有主属性清单

将程序按照maven的package打包后在target路径中执行java -jar Test.jar后报jar中没有主属性清单,将下段粘贴到pom.xml后解决:<build> <plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-shade-plugin</artifact...

2021-11-08 14:48:07 276

原创 kafka使用与报错解决

cdh5.10安装的kafka版本为:2.2.1-kafka-4.1.0,安装成功后看到kafka快速开始的第一条命令为创建kafka-topics.sh,执行find / -name "kafka-topics.sh",路径为/opt/cloudera/parcels/KAFKA-4.1.0-1.4.1.0.p0.4/lib/kafka/bin/,进入此路径,执行如下命令():创建一个topic:./kafka-topics.sh --create --topic quickstart-events

2021-04-28 16:54:58 672

原创 redhat7.4离线搭建cdh6.3.1(四节点)

一.安装版本---------------------------------------------------------------------------------------------------------------------linus版本:red hat7.4...

2020-06-02 09:17:00 1805 1

原创 sqoop开启多并行度时报错

使用sqoop传输数据时,如果开启多并行度会产生各种问题,比如传输完成后缺少一部分数据、传输过程中报错等,解决方法为并行度-m设为1,但是写多个传输脚本同时进行传输,提高传输效率,让多个脚本同时传输的命令如下:sh sqoop_oracle_to_hive_1.sh>sqoop_oracle_to_hive_1.log 2>&1 &sh sqoop_oracle_...

2019-09-11 16:19:24 621

原创 对shell命令设置如果执行不成功则重新执行

语句为:if [[ $? != 0 ]]then命令elseecho " success!"fi

2019-09-11 16:15:00 3381

原创 sqoop export踩过的坑

使用sqoop export时遇到了以下的坑:username必须大写;在关系型数据库建目标表时表名必须大写;export-dir必须小写;tablename必须大写;

2019-09-11 16:12:33 1809 1

原创 使用sqoop eval 操作关系型数据库

想在sqoop export从hive抽取数据到关系型数据库前先操作关系型数据库,把目标表的数据清除一下,可以使用sqoop eval参数:sqoop eval --connect jdbc:oracle:thin:@10.1.4.10:1521:ORCL\--username USER\--password pass \--query "truncate table TABLE_NAM...

2019-09-11 16:08:37 2378

原创 impala和hive语法的区别

最近在工作中遇到了一些语句在impala可以执行但hive不支持的情况,内容如下:hive的date_sub函数对应impala的days_sub函数hive不支持add_years函数,只支持add_months函数hive的TIMESTAMP对应impala的to_TIMESTAMP函数hive的FROM_UNIXTIME函数要求参数必须是'yyyy-MM-dd HH:mm:s...

2019-09-11 15:57:54 3438

原创 HDFS学习笔记

HDFS:Hadoop Distributed File System Hadoop 分布式文件系统将大文件,大批量文件,分布式的存放于大量服务器上。以便于采取分而治之的方式对海量数据进行运算分析;HDFS 设计思路:1.大文件被切割成小文件,使用分而治之的思想让很多服务器对同一个文件进行联合管理2.每个小文件做冗余备份,并且分散存到不同的服务器,做到高可靠不丢失...

2019-03-09 17:38:37 308

原创 搭建hadoop集群

hadoop集群搭建的准备操作: 准备大数据集群(三台或者四台服务器,推荐四台) 推荐:四台服务器的主机名分别是:hadoop02, hadoop03, hadoop04, hadoop05 对以上四台服务器需要做以下准备操作,这些准备都是为了将来搭建hadoop集群做准备的 1、修改各服务器的主机名   vi /etc/sysconfig/network2、配...

2019-02-01 11:38:48 147

原创 python学习笔记

if-else简化版:表达式1  if 表达式  else 表达式2y = 5x = "大于0" if y &gt; 0 else "小于0"print(x)输入数值,判断是工作日还是休息日,或者输入错误。day = int(input("请输入数值:"))content = "工作日" if 1 &lt;= day &lt;= 5 else ("休息日" if day == 6 or

2019-02-01 10:55:08 260

原创 informatica学习笔记

Repository manager(资料库内容管理客户端工具)管理repository service(元数据资料库服务)。Administratortion console(基于web的管理控制台)管理integration service(数据抽取、转换、装载服务)。一.INFA开发流程:R用来在使用infa开发之前做一些准备工作,比如创建用户,创建工作文件夹D用来设...

2018-09-20 10:17:39 1117

原创 《oracle数据库讲义》笔记

字符串大小写敏感Insert into t2(c1) values('BEIJING ');Insert into t2(c1) values('beijing ');主健是通过索引实现索引的名称和约束的名称相同删除节点,下级保留select level,empno,ename,mgr from empwhere ename&lt;&gt;'BLAKE'start with (ename='KIN...

2018-07-11 18:01:47 612

原创 工作笔记

收集表的统计信息:DECLAREBEGINDBMS_STATS.GATHER_TABLE_STATS(USER,’F_IS_AGT_M’);END;Chown:用来更改某个目录或文件的用户名和用户组的;Chmod:用来修改某个目录或文件的访问权限。启监听:lsnrctl start;;用MINUS比较两个表时的字段时要把两个表的主键列出来,这样才会根据主键找到两个表对应的唯一一条数据,然后对两个表...

2018-07-11 17:56:51 658

原创 《linux命令行与shell脚本编程大全》笔记

Shell是系统的用户界面,提供了用户与内核进行交互操作的一种接口。它接收用户输入的命令并把它送入内核去执行。  实际上Shell是一个命令解释器,它解释由用户输入的命令并且把它们送到内核。 参数解释:-i :information,执行命令时候提示是否确定执行   Ls –F:区分文件和目录Ls –a(all):列出所有文件Ls –R:显示当前目录下的内容及子目录下的内容通配符:?代表一个字符,...

2018-07-11 16:42:59 343

原创 oracle数据库优化_简略版

在索引块中,既存储每个索引的键值,也存储具有该键值的行的ROWID。所以索引扫描其实分为两步:Ⅰ:扫描索引得到对应的ROWIDⅡ:通过ROWID定位到具体的行读取数据Oracle中的优化器是SQL分析和执行的优化工具,它负责生成、制定SQL的执行计划。Oracle的优化器有两种:·        RBO(Rule-Based Optimization)基于规则的优化器·        CBO(Co...

2018-07-11 16:36:37 226

原创 oracle数据库优化总结

1.      数据库优化基本知识I/O 数据库的基本作用就是实现对数据的管理与查询。随之而来的就是大量的IO操作, 在海量数据的情况下,数据库的性能问题有80%以上和IO有关。优化ORACLE数据库的I/O性能一般有两个方面,一是减少处理时间,二是减少等待事件。数据块oracle每次执行i/o时候就是以oracle块为单位。数据库的逻辑结构包括:数据块,区,段,表空间,数据块是数据库存储基础,是...

2018-07-11 16:35:03 19980 1

转载 truncate table drop

truncate特点:2.删除数据表的数据,但是保留数据表的结构(定义);3.truncate为DDL语句,删除不可回退;delete的特点:1.删除数据表的数据,保留数据表的结构(定义);2.delete为DML语句,删除可回退;drop的特点:1. drop语句除了删除数据还将删除表的结构,如被依赖的约束(constrain),触发器(trigger),索引(ind

2016-07-22 11:17:16 281

原创 exists

exists : 强调的是是否返回结果集,不要求知道返回什么

2016-07-05 10:32:13 189

转载 join中连接条件放置位置

对于JOIN参与的表的关联操作,如果需要不满足连接条件的行也在我们的查询范围内的话,我们就必需把连接条件放在ON后面,而不能放在WHERE后面,如果我们把连接条件放在了WHERE后面,那么所有的LEFT,RIGHT,等这些操作将不起任何作用,对于这种情况,它的效果就完全等同于INNER连接。对于那些不影响选择行的条件,放在ON或者WHERE后面就可以。

2016-03-27 19:45:29 440

oracle Instant Client 32

oracle instant client 32

2015-07-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除