自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(40)
  • 收藏
  • 关注

原创 批量去除影视剧中的片头片尾

去视频片头片尾

2023-10-29 15:09:18 780

原创 IDEA使用过程中遇到的问题

IDEA使用过程中遇到的问题

2022-12-20 13:32:49 906 1

原创 Flink使用过程中遇到的问题记录

Flink读取gz文件,需要文件名后缀为.gz

2021-05-25 11:55:01 348

原创 Flink ON YARN 报错及解决方案

java.lang.NoClassDefFoundError: Could not initialize class org.apache.flink.runtime.entrypoint.parser.CommandLineOptions解决方案:将 flink-shaded-hadoop-2-uber-2.8.3-10.0.jar 放到 $FLINK_HOME/lib 下面JAR包下载地址:https://repo.maven.apache.org/maven2/org/apache/fli.

2021-04-27 14:08:11 2095

原创 Flink写ClickHouse的分布式表

导入 clickhouse-jdbc 依赖<!-- https://mvnrepository.com/artifact/ru.yandex.clickhouse/clickhouse-jdbc --><dependency> <groupId>ru.yandex.clickhouse</groupId> <artifactId>clickhouse-jdbc</artifactId> <versi.

2021-03-31 18:01:17 1213 2

原创 Flink写Elasticsearch导致Checkpoint频繁失败的解决方案

最近做的一个需求,在一个Flink程序中,根据数据里面的ip进行分流,每个流对应一个ES的索引,一共有14个索引,开启checkpoint。运行报错:有些sink始终会导致ck失败,数据量也就100条。出现这个问题后,把ck去掉,程序正常写入,不报错了。==没有ck肯定不行,所以将ck加回来,后来看了下ElasticsearchSinkBase类的代码,实现了CheckpointedFunction接口,重写了snapshotState方法,里面会根据flushOnCheckpoint成员变量判

2021-02-04 11:10:27 992 2

原创 Flink通过JDBC写ClickHouse

定义 AbstractClickHouseJDBCOutputFormatpackage cn.org.hooli.flink.api.java.io.jdbc;import org.apache.flink.api.common.io.RichOutputFormat;import org.apache.flink.configuration.Configuration;import org.slf4j.Logger;import org.slf4j.LoggerFactory;impor

2021-01-27 17:49:01 1972 1

原创 MySQL5.7安装审计插件

下载地址wget https://bintray.com/mcafee/mysql-audit-plugin/download_file?file_path=audit-plugin-mysql-5.7-1.1.4-725-linux-x86_64.zip重命名压缩包mv file_path=audit-plugin-mysql-5.7-1.1.4-725-linux-x86_64.zip audit-plugin-mysql-5.7-1.1.4-725.zip解压压缩包unzip audit

2021-01-26 09:44:05 1459

原创 Ubuntu20安装MySQL5.7

下载安装包wget https://cdn.mysql.com/archives/mysql-5.7/mysql-server_5.7.32-1ubuntu18.04_amd64.deb-bundle.tar解压压缩包tar -xvf mysql-server_5.7.32-1ubuntu18.04_amd64.deb-bundle.tar安装MySQLsudo dpkg -i mysql-common_5.7.32-1ubuntu18.04_amd64.debsudo dpkg -i li

2021-01-26 09:27:54 691

原创 使用logback写Kafka

使用logback写Kafkapom.xml<logback.version>1.2.3</logback.version><dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka_2.11</artifactId> <version>2.2.0</version> <exclusions> &

2021-01-11 18:14:05 1764 1

原创 将spark输出到hdfs的文本数据压缩成gzip格式

适合Spark SQL和Spark Structured Streaming直接上代码SparkSession spark = SparkSession .builder() .appName("spark-job") .getOrCreate();RuntimeConfig conf = spa...

2020-04-01 18:00:43 2591

原创 将flink输出到hdfs的数据压缩成gzip格式

将flink输出到hdfs的数据压缩成gzip格式CompressionOutputStreamWrapper.classimport org.apache.hadoop.io.compress.CompressionOutputStream;import java.io.Serializable;public class CompressionOutputStreamWrapper ...

2019-08-14 15:30:56 2465 5

原创 \t \n(特殊字符)从外部传入java main方法里无法正常使用处理

pom导入<!-- https://mvnrepository.com/artifact/org.apache.commons/commons-text --><dependency> <groupId>org.apache.commons</groupId> <artifactId>commons-text</...

2019-08-13 17:00:24 555

原创 Spark对多HDFS集群Namenode HA的支持

具体的配置需要参考core-site.xml和hdfs-site.xmlval sc = new SparkContext()// 多个HDFS的相同配置sc.hadoopConfiguration.set(&amp;quot;fs.defaultFS&amp;quot;, &amp;quot;hdfs://cluster1&amp;quot;, &amp;quot;hdfs://cluster2&amp;quot;);sc.hadoopConfigu

2018-10-16 19:19:19 1207

原创 Hive使用ORC存储的问题

类型问题: count distinct(case when num &gt; 0 then id else null end) 问题 如果num&lt;=0,就返回null,正常情况下这个结果为0,但是,如果id类型为bigint,那这个结果为1(错误) 解决 更改为:cast(id as string) count distinct(case when num &gt; 0 the...

2018-04-18 17:44:05 1239

原创 HBase行键设计和Scan快速索引

HBase行键设计和Scan快速索引

2017-04-21 11:08:51 2353

原创 hive修改MySQL里的元数据删除分区

hive修改MySQL里的元数据删除分区

2017-03-06 12:48:37 2683 1

原创 使用Sqoop遇到的问题

使用Sqoop遇到的问题

2016-12-19 14:32:18 1763

原创 HBase + Solr Cloud实现HBase二级索引

HBase + Solr Cloud实现HBase二级索引

2016-11-02 15:36:09 4858

原创 Solr 6.2.1 集群部署

Solr 6.2.1 集群部署

2016-11-02 15:27:15 3080

原创 HBase JAVA API 开发

HBase JAVA API 开发

2016-10-20 17:46:53 468

原创 Ambari告警邮件配置

Ambari告警邮件配置

2016-10-18 14:50:36 3694 1

原创 Ambari删除节点

Ambari删除节点

2016-09-27 10:02:01 6066 3

原创 Kafka使用ambari安装遇到的问题

Kafka使用ambari安装遇到的问题

2016-09-21 16:11:28 4915

原创 Linux下Rsync+Inotify-tools实现数据实时同步

rsync+inotify

2016-06-16 14:46:34 480

原创 ganglia与nagios组合使用

1.复制check_ganglia.py到/usr/lib64/nagios/pluginscheck_ganglia.py(自行修改的,官方的有BUG) “`!/usr/bin/env pythonimport sys import getopt import socket import xml.parsers.expatclass GParser: def init(self,

2016-05-20 15:37:29 1203

原创 nagios安装和配置

nagios安装和配置

2016-05-20 15:35:22 482

原创 ganglia安装和配置

1.安装依赖yum -y install httpd-devel automake autoconf libtool ncurses-devel libxslt groff pcre-devel pkgconfig2.安装ganglia-gmetad 和 ganglia-webyum search gangliayum install -y ganglia-gmetad.x86_64 gangli

2016-05-20 15:20:45 433

原创 Storm整合HDFS

storm-hdfs.jar

2016-04-28 14:41:42 2886

原创 Flume NG与MySQL整合开发

flume整合MySQL

2016-04-14 15:06:54 3352 2

原创 Sqoop增量导入Hive

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-12-22 10:51:25 10016

原创 Nginx + Tomcat 负载均衡 会话同步

准备软件Nginx http://nginx.org/ Tomcat http://tomcat.apache.org/download-70.cgi配置Nginxnginx.confworker_processes 1;error_log logs/error.log info;pid logs/nginx.pid;events { worker_connections 10

2015-04-09 14:43:11 573

原创 MySQL&MariaDB主从同步

MySQL&MariaDB主从同步

2015-03-27 11:44:38 1136

原创 笔记

Map集合put的顺序与存储顺序一致使用 LinkedHashMap

2015-03-13 11:54:26 347

原创 使用Spring Task实现轻量级调度

applicationContext.xml<task:annotation-driven executor="executor" scheduler="scheduler" /><task:executor id="executor" pool-size="50" /><task:scheduler id="scheduler" pool-size="1000" />Java Code@Com

2015-03-06 15:57:21 342

原创 Mybatis--Mapper文件中使用静态方法

@org.apache.commons.lang3.StringUtils@isNotBlank(name)

2015-02-11 14:29:13 4738 1

原创 Mybatis中使用ehcache

maven<!-- 二级缓存 --><dependency> <groupId>org.mybatis.caches</groupId> <artifactId>mybatis-ehcache</artifactId> <version>1.0.3</version></dependency><dependency> <groupId>net.sf.ehcach

2015-02-11 14:15:15 727

原创 Apache + Tomcat采用AJP实现负载均衡与session同步

说明:以下是基于Win7 + Apache2.2 + Tomcat7进行的配置负载均衡Apache的安装目录修改配置文件 Httpd.conf<!-- 打开注释内容 -->LoadModule proxy_module modules/mod_proxy.soLoadModule proxy_ajp_module modules/mod_proxy_ajp.soLoadModule pro

2015-02-11 11:52:54 1408

原创 SpringMVC4.1中使用FastJson

pom.xml&lt;project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-...

2015-01-16 11:01:41 3187

原创 将java项目部署到ROOT下

在项目

2014-06-12 15:45:13 758

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除