bankq
码龄8年
关注
提问 私信
  • 博客:63,385
    63,385
    总访问量
  • 34
    原创
  • 1,695,084
    排名
  • 14
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 加入CSDN时间: 2016-11-16
博客简介:

bankq的博客

博客描述:
记录自己的成长
查看详细资料
个人成就
  • 获得23次点赞
  • 内容获得12次评论
  • 获得101次收藏
  • 代码片获得712次分享
创作历程
  • 9篇
    2023年
  • 1篇
    2021年
  • 3篇
    2020年
  • 21篇
    2019年
  • 1篇
    2016年
成就勋章
TA的专栏
  • springboot
    2篇
  • flink
    1篇
  • Elasticsearch
    12篇
  • 大数据
    7篇
  • linux小脚本
    2篇
  • java
    6篇
  • shell脚本
    2篇
兴趣领域 设置
  • 大数据
    hadoopsparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Springboot2+WebSocket

【代码】Springboot2+WebSocket。
原创
发布博客 2023.11.28 ·
409 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

linux环境执行jar脚本

jar包运行脚本
原创
发布博客 2023.10.24 ·
767 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

http请求工具类

http请求工具类
原创
发布博客 2023.10.09 ·
549 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

File文件操作工具类

【代码】File文件操作工具类。
原创
发布博客 2023.09.22 ·
118 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

@DateTimeFormat 和 @JsonFormat 的详细研究

@DateTimeFormat 和 @JsonFormat 的详细研究
原创
发布博客 2023.09.22 ·
708 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HDFS文件系统中,Fsimage和Edits

当客户端对HDFS中的文件进行新增或者修改操作,操作记录首先被记入Edits日志文件中,当客户端操作成功后,相应的元数据会更新到内存数据中。文件块位置信息只存储在内存中,是在DataNode加入集群的时候,NameNode询问DataNode得到的,并且间断的更新。Fsimage和Edits文件都是经过序列化的,在NameNode启动时,它会将Fsimage文件中的内容加载到内存中,之后再执行Edits文件中的各项操作,使得内存中的元数据和实际的同步,存在内存中的元数据支持客户端读操作,也是完整的元数据。
原创
发布博客 2023.07.24 ·
617 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HDFS的文件块大小(重点)

对于一般硬盘来说,传输速率为100M/s,一般设置块的大小128M,因为128是2的7次方,最接近于100M。比如,块的大小是1TB,传输这个1TB的数据会非常慢,并且程序处理这个1TB的数据时,也非常的慢。不是的,它只占用文件本身大小的空间,其它空间别的文件也可以用,所以这128M的含义是HDFS数据块的大小,和每个文件的大小没有关系。HDFS的块设置太小,会增加寻址时间。例如,块的大小是1KB,文件大小是100KB,这时候要分100个块来存储文件,读取文件时要找到100个块的地址,会大大增加寻址时间。
原创
发布博客 2023.07.24 ·
2167 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

mysql 列转行

mysql 一行转多行,关联维表信息后转一行
原创
发布博客 2023.05.15 ·
6863 阅读 ·
2 点赞 ·
1 评论 ·
9 收藏

springboot基于quartz实现自定义时间的定时调度

Quartz是一套轻量级的任务调度框架,只需要定义了 Job(任务),Trigger(触发器)和 Scheduler(调度器),即可实现一个定时调度能力。
原创
发布博客 2023.04.22 ·
1240 阅读 ·
2 点赞 ·
0 评论 ·
9 收藏

flink根据checkpoints状态恢复数据

说明flink消费kafak数据至ES在程序中已经启用了checkpoints1、启动flink程序[bigdata@cdh03 /bigdata/flink-1.7.2-client/sh]$cat submit-flink-yarn-merge.sh#!/bin/bash​#-m 运行模式,这里使用yarn-cluster,即yarn集群模式。#-ys slot个数。#-ynm Yarn application的名字。#-yn task manager 数量。-yn
原创
发布博客 2021.07.02 ·
5453 阅读 ·
8 点赞 ·
1 评论 ·
23 收藏

Elasticsearch更新mapping

概述Elasticsearch 的 mapping 在创建 indices 时即已确定,无法更改。那么,当我们需要更新 mapping 时,该如何是好呢?基本思路当我们在创建一条索引时,添加好 mapping 后,可设置一个 alias 指向该索引,然后生产环境采用该 alias 来索引数据。当然,如果没有这样做的话,建议趁早备份,修改 API 。既然已创建的 indices 无法修改,我们可以重新创建一个新的 indices, 然后将原 indices 上的数据复制到新的 indices 上
原创
发布博客 2020.10.20 ·
3940 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

springboot2.x集成elasticsearch6.x

概述本博客基于SpringBoot-2.1.6.RELEASE、elasticsearch-6.5.4版本整理。1、maven依赖 <!-- elasticsearch启动器 (必须) 不能使用自带的es-start--> <dependency> <groupId>org.elasticsearch</groupId> <artifactId>elasticsearch
原创
发布博客 2020.05.11 ·
754 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

linux安装Oracle11G

linux安装Oracle11G0、下载Orcle11Goracle10G/11G官方下载地址合集(直接迅雷下载)说明一下:[root@myYUn install]#中的myYUn等价于[root@iz2f570bi1k56uz install]#中的iz2f570bi1k56uz;这是为了界面效果调整的,但是有些没调整到,理解一哈。1、上传文件到服务器...
转载
发布博客 2019.12.18 ·
275 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Elasticsearch 基于原有动态模板新增字段

概述记录一次自己在操作Elasticsearch数据库新增一个字段出现的问题,由于业务需求,我们需要往ES中新增了一个字段,该字段不能使用keyword类型,因为查询的时候需要对该字段进行模糊查询,这就要求我们在ES原来的模板中新增一个字段设置分词。1、设置分词ES自带了一些分词器,即在默认情况下,如果不对自己创建的索引做任何的设置和修改,ES会按照standard进行分词我业务中...
原创
发布博客 2019.09.24 ·
6402 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

Elasticsearch6.5.4破解x-pack

概要我们常常用kibana界面化操作ES数据库,这样就使得任何人只要知道我们ES数据库的地址和端口就可以任意操作我们的数据库,这样非常不安全,由此一个基于用户认证是否有权限访问和操作我们的数据库的的需求就诞生了,然后我们找到了这个X-pack插件,它能做什么呢?X-Pack 提供以下几个级别保护elastic集群1)用户验证2)授权和基于角色的访问控制3)节点/客户端认证和信道加密...
原创
发布博客 2020.10.21 ·
2607 阅读 ·
4 点赞 ·
2 评论 ·
8 收藏

Elasticsearch cardinality存在误差

概述cardinality 度量是一个近似算法。 它是基于 HyperLogLog++ (HLL)算法的。 HLL 会先对我们的输入作哈希运算,然后根据哈希运算的结果中的 bits 做概率估算从而得到基数。优点:性能快,亿级别的记录在1秒内完成 缺点:存在只能保证最大40000条记录内的精确,超过的存在5%的误差,不适合需要精确去重场景1、示例:GET ...
原创
发布博客 2019.06.20 ·
3898 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

Elasticsearch settings管理

概述在工作中,我们常常需要对setting做一些微调,这个时候我们应该如何处理?settings是针对索引库而言修改分片和副本数的。一个索引库的setting如下{ "poc2" : { "settings" : { "index" : { "refresh_interval" : "10s", "number_of_sha...
原创
发布博客 2019.05.31 ·
3048 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Elasticsearch 别名管理

概述记录自己在工作中将ES数据库从5.2.0升级到6.X版本,ES的索引库type发生变化,由于ES6.x版本只有一种type(tyep为doc),造成数据存在两个不同的type中,我们把ES6.x中的数据存在其他索引表中,通过建立索引名称关联5.x和6.x的数据。1、添加别名#添加别名 index :poc2 添加别名为:pocPOST /_aliases?pretty{ ...
原创
发布博客 2019.05.31 ·
1478 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Elasticsearch 索引模板

概述记录自己在工作中将生产的数据按月保存在ES中(通过logstash采集kafka数据到ES),由于生产环境数据量比较庞大(一天的日志量大概在2500万条左右),为了后期减轻服务器压力,方便我们维护,所以需要对我们的日志进行处理,按月建立不同的ES索引库,能够查询最近6个月的日志,关闭前6个月不用的日志。创建模板如果用户每次新建一个索引的时候都需要手动创建mapping非常麻烦,es...
原创
发布博客 2019.05.31 ·
8015 阅读 ·
1 点赞 ·
5 评论 ·
11 收藏

shell脚本一键安装kafka集群

shell脚本一键安装kafka集群#!/bin/bash#在脚本的位置存放安装包kafka_2.11-0.10.2.1.tgzcurrentTime=$(date '+%Y-%m-%d %H:%M:%S')echo -e "请输入kafka的安装目录,不存在脚本自动创建,最后一个/不要写 /bigdata/install"read kafkainstallpath#创建KAFKA安...
原创
发布博客 2019.05.24 ·
558 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏
加载更多