小强签名设计-CSDN博客

原创豆瓣最新国产电影Top10

我这里整理了下豆瓣目前来说排名最高的国产电影Top10Top1经典台词：1.真虞姬，假霸王2.不疯魔不成活（巩俐当时颜值爆表啊）经典画面：Top2经典台词：1.曾经有一份真挚的爱情摆在我的面前，可是我没有珍惜，等到失去的时候才后悔莫及，尘世间最痛苦的事莫过于此．如果上天可以让我再来一次的话，我会对那个女孩子说三个字：我爱你．如果要给这份爱加一个期限，我希望是一万年．2.我的意中人是个盖世英雄，有一...

2018-02-04 12:27:53 3408

原创换个眼界，换种心情

大家刚看我博客的时候肯定会好奇，为什么要起这个昵称呢，难道你会签名设计不成？？？在下不才，曾经在大学期间做过一段时间的签名设计，也就是小打小闹，体验了下过程罢了，不过经历还是值得回忆的。以下是我的一些作品，不为别的，就为作为IT的我们换个眼界，没必要整天眼中都是代码什么的，放松一下心情吧。登录新浪微博可...

2017-07-23 15:30:44 1270

原创 kubernetes-client 杀死对应的 pod 任务

2026-01-27 16:10:48 27

原创 Azkaban 使用

文中文中使用到的软件版本：Azkaban 3.90.0、MySQL 5.7、Centos 7。一个 project 包含多个 flow，一个 flow 包含多个 job，job 之间可以有依赖关系。

2025-12-11 11:57:06 293

原创 CSV 字段映射小工具 Demo

本文介绍了一个CSV表头映射工具，采用前后端分离架构（Vue+SpringBoot）。该工具可读取CSV文件表头，自定义数据仓库字段映射关系，并生成对应的JSON配置文件。文中展示了工具界面效果和生成的mapping.json文件示例，并提供了项目目录结构说明。前端部分代码未展开，但整体实现了便捷的字段映射配置功能，适用于数据仓库建设中的元数据管理场景。

2025-07-16 09:52:20 355

原创 Windows 环境 NPM 安装

本文介绍了Node.js环境安装与NPM配置优化的完整流程。首先需从Node.js官网下载LTS版本进行安装，安装后可通过命令行验证版本。其次为提高npm下载速度，提供了三种镜像配置方法：使用别名快捷命令、修改npm配置文件注册表，或直接安装第三方cnpm工具。每种方法都附有具体操作命令和配置验证方式，适合不同用户需求。通过简单的配置即可显著提升npm包管理器的下载效率。

2025-07-15 17:54:03 555

原创 Go语言第一个程序--hello world!

本文简要介绍了Go语言的安装与程序运行方法。首先提供了Go语言官方下载链接，并展示了安装步骤。安装完成后可通过go version命令验证。接着讲解了如何创建项目文件夹并进行初始化(go mod init)，以及编写简单的main.go文件示例。最后演示了使用go build命令生成可执行文件的过程。该指南适合Go语言初学者快速搭建开发环境并运行第一个程序。

2025-07-14 16:10:54 615

原创 Redis 使用及命令操作

（Ps：需重启 Redis 才能生效） redis 的查询速度是非常快的，外部用户一秒内可以尝试多大150K个密码；如果防火墙或者用来保护 redis 的系统防御外部攻击失败的话，外部用户如果没有通过密码认证还是无法访问 redis 的。切换数据库后 Redis 命令行会有数据库 id 的标识，另外，0号数据库不显示标识。FLUSHALL 命令会清空所有数据库中的数据库，不只是当前数据库。Redis 默认提供了16个数据库（database），每个数据库有一个 id，从0到15，他们没有名字，只有 id。

2025-05-06 15:39:51 2179

原创 ElasticSearch 分词器

不同的 Analyzer 会有不同的分词结果，内置的分词器有以下几种，基本上内置的 Analyzer 包括 Language Analyzers 在内，对中文的分词都不够友好，中文分词需要安装其它 Analyzer。可以看出是按照空格、非字母的方式对输入的文本进行了转换，比如对 Java 做了转小写，对一些停用词也没有去掉，比如 in，其中 token 为分词结果；有时在淘宝搜索商品的时候，会发现使用汉字、拼音、或者拼音混合汉字都会出来想要的搜索结果，其实是通过拼音搜索插件实现的。：会做最粗粒度的拆分。

2025-03-26 17:39:29 2164

原创 Elasticsearch Sql 查询

ElasticSearch 从6.3.0版本也开始支持 SQL 查询了。在早期版本中，Elasticsearch 执行 SQL 的 REST 接口为_xpack/sql，但在版本 7 以后这个接口已经被废止而推荐使用_sql接口。Elasticsearch 支持传统关系型数据库 SQL 语句中的查询语句，但并不支持DML、DCL 句。换句话说，它只支持 SELECT 语句，不支持 INSERT、UPDATE、DELETE语句。

2025-03-17 19:16:19 1032

原创 Flink 1.17.2 版本用 java 读取 starrocks

在 Flink 1.17.2 中使用 Java 读取 StarRocks 数据，可以通过 JDBC 连接器或 StarRocks 官方提供的 Flink Connector 实现。StarRocks 兼容 MySQL 协议，可通过 Flink 的 JDBC 连接器读取数据。StarRocks 提供官方 Connector，支持高效读写。

2025-03-12 21:14:21 997

原创 Docker 单机快速部署大数据各组件

【代码】Docker部署大数据各组件。

2025-01-20 15:45:45 1432

原创 Flink DataSet API

文章目录DataSet SourcesDataSet TransformationDataSet Sink序列化器一、样例一：读 csv 文件生成 csv 文件二、样例二：读 starrocks 写 starrocks三、样例三：DataSet、Table Sql 处理后写入 StarRocks四、`DataSet<Row>` 遍历分类：Source：数据源创建初始数据集，例如来自文件或 Java 集合。Transformation：数据转换将一个或多个 DataSet 转换为新的 Da

2025-01-03 15:01:54 992

原创 SQL语句整理五-StarRocks

【代码】SQL语句整理五-

2024-12-20 11:24:50 1467

原创 Flink UDF

一、样例一：读 csv 文件生成 csv 文件参考：（3）Flink学习- Table API & SQL编程准备测试文件：运行程序后会生成文件。

2024-11-27 16:22:07 784

原创 Flink CDC 同步 Mysql 数据

Flink CDC 基于数据库日志的技术，实现了全量和增量的一体化读取能力，并借助 Flink 优秀的管道能力和丰富的上下游生态，支持捕获多种数据库的变更，并将这些变更实时同步到下游存储。

2024-10-30 20:31:55 1771 1

原创 Debian安装mysql遇到的问题解决及yum源配置

每次发布的版本都是稳定版，而测试版在经过一段时间的测试证明没有问题后会成为新的稳定。而不稳定版的代号永远是 sid。第三部分表示你的debian版本号（注意，不是某个软件的版本号，而是debian本身的版本号），也有人称这是对debian软件包的一种水平划分（这种说法还是比较形象的），具体这一项怎么写，可以参看http://mirrors.163.com/debian/dists/网页里面的内容（如下图），大致来说按版本的旧–>新程度有这么几大类：oldstable，stable，testing，sid。

2024-09-23 11:27:49 1830

原创 K8S 上部署 Prometheus + Grafana

【代码】K8S 上部署 Prometheus + Grafana。

2024-07-22 14:17:37 2253

原创 K8S 上部署 Emqx

访问 Kubernetes 的任意一台节点 IP 的 32717 端口，输入默认用户名：admin，默认密码：public，登陆 EMQX dashboard。可以看到 my-emqx 的 18083 端口对应的宿主机的 32717 端口。（NodePort 在每次部署的时候都会变化，以实际部署时为准。启动 EMQX 集群，设置。

2024-07-15 09:53:28 2427 5

原创 K8S 上部署 Redis

【代码】K8S 上部署大数据相关组件。

2024-07-08 16:16:17 758

原创 Kubernetes(K8s) kubectl 常用命令

【代码】Kubernetes(K8s) kubectl 常用命令。

2024-07-03 15:12:30 3093

原创 Apache Commons 读写 CSV 文件

【代码】Apache Commons 读写 CSV 文件。

2024-07-01 10:36:32 1295

原创 Java代码常用功能实现总结（三）

上述是几种不同的方法来遍历目录下的文件，包括递归、栈和队列。通过递归的方法，可以在遇到子文件夹时自动进入子文件夹继续遍历；而栈和队列的方法通过维护一个待处理的文件集合，不断处理集合中的文件，可以实现相同的效果。确保在运行此代码之前，已经设置好Hadoop的相关配置，并且有权限对HDFS上的文件进行操作。此外，需要有一个编译Java的环境，并且确保已经添加了Hadoop的相关依赖库。方法之前，旧文件存在，并且没有其他进程正在使用该文件。同时，确保应用程序有足够的权限去更改文件名，并且目标路径存在。

2024-04-22 14:54:56 1574 1

原创 Parquet 文件生成和读取

这种方式的 User 实体类和上面方式的 schema.avsc 文件中的。

2024-02-26 16:19:48 10394 1

原创 Redis安装及使用

简单来说 redis 就是一个数据库，不过与传统数据库不同的是 redis 的数据是存在内存中的，所以读写速度非常快，因此 redis 被广泛应用于缓存方向。另外，redis 也经常用来做分布式锁。为什么要用 redis/为什么要用缓存？主要从“高性能”和“高并发”这两点来看待这个问题。高性能：假如用户第一次访问数据库中的某些数据，这个过程会比较慢，因为是从硬盘上读取的。如果该用户访问的数据存在缓存中，这样下一次再访问这些数据的时候就可以直接从缓存中获取了。

2024-01-16 10:54:16 954

原创 CDH 6.3.2-1 离线安装部署（Centos7.9）

三台服务器都操作：三、安装 Cloudera-Manager四、访问 Cloudera Manager五、集群异常信息解决参考：Linux搭建Cloudera Manager+CDH6.3.1环境

2023-12-27 11:20:52 1705

原创 SQL语句整理二--Mysql

这个是要区分环境的。就遇到了本来想根据三个字段去插入数据，结果 unique 索引只设置了两个字段，这就导致本来想插入两个字段值一样另一个字段值不一样的五条数据，但不一样的那个字段没设置为 unique 索引，这就导致只插入了一条循环后的最后一条数据。开窗函数与聚合函数一样，也是对行集组进行聚合计算，但是它不像普通聚合函数那样每组只返回一个值，开窗函数可以为每组返回多个值，因为开窗函数所执行聚合计算的行集组是窗口。会覆盖不指定字段的值，比如我更新字段1和2之前字段3的值为5，字段3设置的默认值为0，则。

2023-12-18 16:17:05 1500

原创 MinIo 的操作与使用和避坑

尝试解决2：新建一个纯 Maven 项目。

2023-12-05 17:13:08 4200 1

原创 Java 操作阿里 OSS

【代码】读取阿里OSS的txt文件。

2023-11-15 16:02:12 1699

原创浪潮服务器安装操作系统

一开始认为将镜像文件导入U盘即可，但实操中并不行，得首先将U盘制作成启动盘才行。打开刻录软件，选择光盘镜像文件，点击”写入硬盘映像”，以下是刻录过程的截图。首先需要确定安装的版本，我这里要安装的是。

2023-11-14 11:57:30 4876

原创 Rclone 上传本地文件到 OSS

上面是通过 Amazon S3 协议挂载的 OSS，符合亚马逊 S3 标准的存储提供商，包括 AWS、阿里巴巴、Ceph、中国移动、Cloudflare、ArvanCloud、DigitalOcean、Dreamhost、华为OBS、IBM COS、IDrive e2、IONOS Cloud、Liara、Lyve Cloud、Minio、网易、RackCorp、Scaleway、SeaweedFS、StackPath、Storj、腾讯COS、Qiniu 和 Wasabi。

2023-11-13 12:00:27 2535

原创 Spark Dataset 的一些 api 操作

【代码】Dataset 的一些 Java api 操作。

2023-09-04 09:47:48 2032

原创 Hbase的bulkload流程与实践

通常MapReduce在写HBase时使用的是方式，在 reduce 中直接生成 put 对象写入HBase，该方式在大数据量写入时效率低下（HBase 会 block 写入，频繁进行 flush、split、compact 等大量 IO 操作），并对HBase节点的稳定性造成一定的影响（GC 时间过长，响应变慢，导致节点超时退出，并引起一系列连锁反应），而HBase支持bulk load的入库方式，它是利用hbase的数据信息按照特定格式存储在hdfs内这一原理，直接在HDFS中生成持久化的HFile。

2023-06-15 10:03:21 3913

转载漫谈数据仓库之拉链表（原理、设计以及在Hive中的实现）

本文将会谈一谈在数据仓库中拉链表相关的内容，包括它的原理、设计、以及在我们大数据场景下的实现方式。先分享一下拉链表的用途、什么是拉链表。通过一些小的使用场景来对拉链表做近一步的阐释，以及拉链表和常用的切片表的区别。举一个具体的应用场景，来设计并实现一份拉链表，最后并通过一些例子说明如何使用我们设计的这张表（因为现在Hive的大规模使用，我们会以Hive场景下的设计为例分析一下拉链表的优缺点，并对前面的提到的一些内容进行补充说明，比如说拉链表和流水表的区别。

2023-05-11 22:20:37 1178

原创 Doris单机部署

Doris 的简单部署使用

2023-02-22 10:21:59 2190

原创 Word技能总结

Word技巧总结

2023-01-12 15:05:37 1467

原创 Html 小功能总结二

HTML 小功能总结

2022-12-16 15:09:01 1028

原创 Html 小功能总结一

当然有一种方式是在页面跳转前，先发个请求到后台将值存储到session中，跳转后再发个请求到后台取出。这种方式不仅仅慢而且还特别耗费资源。以下有其他的几种方式：

2022-11-24 14:52:43 556

原创前端--上传功能

前端--上传功能总结

2022-10-29 20:34:47 1912

原创 Neo4j的安装和使用

Neo4j是一个高性能的NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络（从数学角度叫做图）上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下，而不是严格、静态的表中。但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。Neo4j因其嵌入式、高性能、轻量级等优势，越来越受到关注。现实中很多数据都是

2022-06-15 16:05:48 2104

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

CSV 字段映射小工具 Demo

OpenDetectorDeveloperGuide.pdf（中文版）

Snort_3.0.0-a4-241_on_Ubuntu_14_and_16.pdf

SimHei MAC字体资源

hadoop.dll 文件，解决报错所需文件

大数据技术之高频面试题

HDP3.1.5.0+Ambari2.7.5安装部署（Centos7.2）所需的三台Ambari镜像

大数据各组件安装（数据中台搭建）所需安装包

大数据设计方案.docx

oozie所需的js包文件

flume自定义功能实现代码

ganglia安装所需rpm包

flumee.zip

sqlite所需的包

apache-maven-3.3.9-bin.zip

解析json的jar包

flume断点续传

flume-ng-1.6.0-cdh5.5.2-src.tar.gz

Myeclipse 10.x 2013 2014 破解补丁

google-collections-1.0.jar

winutils.exe

elasticsearch-2.2.0.tar.gz

jsoup-1.10.2.jar

httpcomponents-client-4.5.3-bin.tar.gz

mysql源码安装脚本

GIF动画录制工具

protobuf-2.5.0.tar.gz

博客微信网页授权文章所需

空空如也