自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 资源 (7)
  • 收藏
  • 关注

原创 matplotlib中文乱码解决

djfldsjfasdfasdf

2022-11-28 21:57:08 162 1

原创 redis集群相关

redis集群相关设置

2022-07-28 17:20:55 154

原创 仓库设置dfsf

maven仓库设置

2022-07-27 10:06:29 247

原创 git的pull失败

git的pull失败refusing to merge unrelated histories

2022-07-26 11:06:04 177

原创 科学计数转string

科学计数转string

2022-07-19 14:24:35 852

原创 spark写iceberg

MERGE INTO prod.db.target t -- a target tableUSING (SELECT ...) s -- the source updatesON t.id = s.id -- condition to find updates for target rowsWHEN ... -- updatesWHEN MATCHED AND s.op = 'delete' THEN .

2022-05-31 14:04:01 307

原创 idea无法下载source

idea无法downsource

2022-05-30 15:08:55 128

原创 sprk与es

<dependency> <groupId>org.elasticsearch</groupId> <artifactId>elasticsearch-spark-20_2.11</artifactId> <version>6.7.2</version> </dependency>scala> val df = .

2022-04-24 18:11:58 132

原创 随意写两下1111

顺便写两下;剑荡四方

2022-02-11 17:30:06 902

原创 redis简要

redisredis是key-value内存数据库,线程安全,高并发,由于是内存数据库,存储能力有限,不宜存储过长的key,适用于高并发访问,公共数据的存储数据类型Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合)。1)字符型redis 127.0.0.1:6379> SET runoobkey redisOKredis 127.0.0.1:6379> GET runoobk..

2021-03-05 16:57:15 77

原创 ES的查询语句

ES的查询语句ES的查询语句match语句前面提到match搜索会先对搜索词进行分词,对于最基本的match搜索来说,只要搜索词的分词集合中的一个或多个存在于文档中即可,例如,当我们搜索中国杭州,搜索词会先分词为中国和杭州,只要文档中包含搜索和杭州任意一个词,都会被搜索到term更加精确的匹配GET my_index/_search{“query”: {“term”: {“exact_value”: “Quick Foxes!”}}}多个查询terms 类似于 inGET /_

2021-01-28 11:36:34 1063

原创 hive的开窗函数

range between UNBOUNDEDPRECEDING andCURRENT ROW |UNBOUNDEDFOLLOWINGrows between 1 preceding and 2 followingrange表示排序字段实际值范围值,两个一样的值,值是一样的rows 表示排序值,两个值一样的也有先后顺序...

2021-01-28 10:50:15 98

原创 参数工具类

public class PropertiesUtil { private static final Logger logger = LoggerFactory.getLogger(PropertiesUtil.class); private static Properties prop = null; private static String properPath = ConstantsDefine.CONFIG_PATH + "*.properties"; //静.

2020-06-23 10:44:34 358

原创 flink基本配置

基础配置final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.enableCheckpointing(5000);// 设置checkpoint的周期env.getCheckpointConfig().setMinPauseBetweenCheckpoints(2000);// 确保检查点之间有至少2000 ms的间隔【checkpoint最小间隔】en

2020-06-23 10:42:27 648

原创 本地缓存

LoadingCache<Map<String, String>, String> xxxx= CacheBuilder.newBuilder() //设置并发级别为10,并发级别是指可以同时写缓存的线程数 .concurrencyLevel(10) //设置写缓存后10分钟没有写操作就重新加载(异步,不阻塞) ...

2019-09-12 14:16:44 125

原创 maven包引用并重命名解决包冲突(maven插件实现)

<plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-shade-plugin</artifactId> ...

2019-09-12 14:07:13 2319

原创 idea中仓库管理

添加maven配置文件以外的仓库:<repositories> <!-- add the elasticsearch repo --> <repository> <id>alimaven</id> <url>http://maven.aliyun.com/nexus/con...

2019-06-28 17:22:57 759

原创 spark读取es

val options = Map("pushdown" -> "true", "es.nodes" -> "10.116.106.*,10.116.106.*,10.116.106.*", "es.port" -> "9200") val esDf: Dataset[Row] = sql.read.format("org.elasticsearch.spark.sql")...

2019-06-25 10:17:12 1787

原创 spark_submit

#!/usr/bin/env bashspark-submit \--master yarn \--deploy-mode client \--driver-memory 5G \--num-executors $5 \--executor-cores $6 \--executor-memory $7 \--queue $8 \--class $3 \$4 \$1 \$2

2019-06-20 14:42:22 80

原创 正则

java测试正则:public static void main(String[] args) { GanXian ganXian = new GanXian(); String rex = "T1\\D"; Pattern.compile(rex);}正则匹配中文:"[\u4e00-\u9fa5]"正则截取示例:SELECT route_code...

2019-06-20 10:29:19 80

原创 本地批量缓存

public abstract class AtomicBatchService<INPUT, RESULT, OUT> implements Serializable { private static final long serialVersionUID = 2931723128262800986L; private static final Logger l...

2019-06-20 10:24:25 293

原创 log4j日志模板

log4j.rootLogger = INFO,root,stdoutlog4j.appender.stdout=org.apache.log4j.ConsoleAppenderlog4j.appender.stdout.layout=org.apache.log4j.PatternLayoutlog4j.appender.stdout.layout.conversionPattern=...

2019-06-20 09:55:58 1192

原创 redis相关工具类

public class RedisSentinelCluster { private static final Logger logger = LoggerFactory.getLogger(RedisSentinelCluster.class); private static JedisSentinelPool pool; private RedisSentin...

2019-06-20 09:50:59 79

原创 scala日期工具

object DateUtil { def strDateFormat(strDate: String, inputFormat : String, outputFormat: String): String = { val input = new SimpleDateFormat(inputFormat) val output = new SimpleDateFormat...

2019-06-20 09:44:11 583

转载 spark读写示例

/* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with * this work for additional informati...

2019-04-09 13:58:45 208

原创 spark-sql与HIve

hive的安装下载hive并解压添加环境变量(增加如下变量)编辑hive-env.sh 加入HADOOP_HOME=/opt/apps/software/hadoop-2.7.3编辑hive-site.xml 加入<property> <name>javax.jdo.option.ConnectionDriverName</name>...

2019-04-08 16:20:16 125

原创 spark高可用安装

下载scala与spark并解压,添加至环境变量编辑spark-env.sh 添加如下变量export JAVA_HOME=/opt/apps/software/jdk1.8.0_201export SCALA_HOME=/opt/apps/software/scala-2.11.8export HADOOP_HOME=/opt/apps/software/hadoop-2.7.3e...

2019-04-08 16:11:06 243

原创 idea测试

导入测试依赖<!-- test start --><dependency> <groupId>org.test4j</groupId> <artifactId>test4j.testng</artifactId> <version>2.0.5</version><...

2019-04-08 10:52:29 325

原创 spark操作

创建sparksession支持hiveval spark = SparkSession.builder().appName(" PlaceCapacity").config("spark.some.config.option", "some-value") .config("spark.sql.hive.filesourcePartitionFileCacheSize", 500 *...

2019-04-04 11:49:39 235

原创 mysql权限

mysql增加用户 (%代表可以登录ip)CREATE USER 'hive'@'%' IDENTIFIED BY 'hive';权限赋予:grant select,delete,update,create,drop on test_hive.* to 'hive'@'%' identified by '123456';赋予所有权 (hive并与database,*表与表)g...

2019-03-27 19:23:23 169

原创 hive安装

下载并解压hive在env中添加HADOOP_HOME=/opt/apps/software/hadoop-2.7.3修改模板hive-site并添加如下<property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdb...

2019-03-27 15:51:12 78

原创 centos7云安装mysql

下载源:wget http://repo.mysql.com/mysql80-community-release-el7.rpm安装 rpm -ivh mysql80-community-release-el7.rpm安装mysqlyum install mysql安装mysql-server yum -y install mysql-server安装 yum -y ins...

2019-03-27 14:29:54 43

原创 centos7的mysql安装

下载安装mysqlhttps://dev.mysql.com/downloads/mysql/解压mysql到指定文件夹 tar xvf 文件 文件夹卸载系统自带的 mariadb-librpm -qa|grep -i mariadb##mariadb-libs-5.5.50-1.el7_2.x86_64 rpm -e mariadb-libs-5.5.50-1.el7_2...

2019-03-27 14:16:52 62

原创 Hadoop高可用集群搭建

1. 配置免密登录 1.ssh-keygen 生成秘钥(文件在目录/root/.ssh下) 2.将公钥追加到cat authorized_keys >> authorized_keys 3.将需要相互登录的机器的公钥发送给各设备,并追加cat authorized_keys >> authorized_keys2.集群规划 ...

2019-03-26 16:02:54 137

windows下的hadoop

windows下的hadoop

2022-09-28

离线打工人_20220117

离线打工

2022-01-17

实时相关理论文档介绍等

实时相关理论文档介绍等

2021-09-16

离线相关理论介绍与实际操作

离线理论

2021-09-16

大数据相关分享文档元数据flink

大数据相关文档

2021-08-10

tank_help_to_tank.zip

tank_help_to_tank.zip

2019-09-20

spark介绍.doc

spark介绍,包括spark简要介绍,以及rdd dataframe sparksql介绍

2019-07-06

sublime_package.zip

sublime的sql格式化插件与package contronner,找到安装sublime text3的位置,解压即可使用

2019-06-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除