月初，-CSDN博客

原创 Windows系统将jar包注册成为系统服务

【代码】Windows系统将jar包注册成为系统服务。

2026-01-16 16:39:19 313

原创 Windows BAT 脚本实现服务自动重启并输出日志（控制台+日志文件）

本文介绍了一种通过.bat脚本实现Spring Boot服务自动化管理的方案，重点解决服务重启时的端口占用、日志输出和窗口管理问题。脚本核心功能包括：1)通过端口检测自动终止旧服务进程；2)使用PowerShell启动新服务并实现日志双输出（控制台+文件）；3)优化窗口管理避免残留。作者详细分析了实现过程中的技术难点，特别是窗口标题匹配的失败原因，并最终采用基于端口PID检测的可靠方案。该方案通过netstat、taskkill等命令组合，实现了服务重启的完整生命周期管理，提升了本地开发效率。

2025-07-29 14:43:38 1376

原创 Git 常用操作大全（超详细教程）一文教会你完全使用Git

🔥 本文总结了 Git 的常用操作命令，包括初始化、上传、拉取、分支管理、回退、忽略文件等，附带完整的上传拉取流程，新手和实习生必备！

2025-07-28 10:57:35 5035

原创使用Docker+Nginx部署电商平台项目（服务端+管理端+商城）

本篇主要介绍如何在docker上打镜像部署，docker镜像部署有点有很多，最主要的一点还是对环境和架构要求较少，可以直接使用自己开发时定义的版本。编译litemall-all模块，同时把litemall-admin编译得到的静态文件拷贝到 litemall-all模块的static目录（因为我是直接通过sftp上传的dist包，所以这里没有给出，大家自己把打好的dist包上传到服务器就行）到这里后端服务已经部署好了，接下来是前端服务，我通过nginx代理，然后再把nginx打到镜像启动。

2025-07-24 19:08:41 785

原创 SpringBoot集成Minio存储文件，开发图片上传等接口

我们平时的学习过程可能只是把文件存储在了本地，但是在实际开发中这肯定是不现实的，所以这时候我们就用到了Minio，MinIO 是一个开源的对象存储服务器。这意味着它允许你在互联网上存储大量数据，比如文件、图片、视频等，而不需要依赖传统的文件系统。MinIO 的特点在于它非常灵活、易于使用，同时也非常强大，可以在你的应用程序中方便地集成。像这样的存储工具还有oss以及七牛等等。这里着重介绍minio开发。

2025-07-16 18:48:01 1024 1

原创 MongoDB学习和应用(高效的非关系型数据库)

MongoDB 最大的特点是他支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。它是一个面向集合的,模式自由的文档型数据库。Spring-data对MongoDB做了支持，使用spring-data-mongodb可以简化MongoDB的操作，封装了底层的mongodb-driver。这种扫描全集合的查询效率是非常低的，特别在处理大量的数据时，查询可以要花费几十秒甚至几分钟，这对网站的性能是非常致命的。

2025-06-06 16:46:12 1398

原创 npm报错 npm ERR! Error while executing:npm ERR! ，npm 启动以及安装过程的各种报错

可以使用 increase-memory-limit 脚本或 --max-old-space-size 选项来增加内存限制，脚本会自动增加 Node.js 进程的内存限制，然后运行 node app.js 命令。我的所有问题都是从这个错误开始的，由于项目是个老项目，依赖包也比较大，所以就会报这个134 内存溢出的问题，咱就按正常流程走一遍来详细解决这个问题。友情提醒：如果项目比较老，包又大，又有一些需要权限的特定包，下载不下来的话，直接把同事包copy过来算了哈哈哈哈哈，不然折腾的老费劲了。

2025-04-08 22:22:19 2732

原创 Drools项目实战

Drools 实战项目，手把手实操教学

2025-04-05 16:01:15 901

原创 WorkBench安装使用

WorkBench是KIE组件中的元素，也称为KIE-WB，是Drools-WB与JBPM-WB的结合体。它是一个可视化的规则编辑器。

2025-04-05 15:37:10 1102

原创规则引擎Drools

规则引擎全称为业务规则管理系统，英文名为BRMS，规则引擎的主要思想是将应用程序中的业务决策部分分离出来，并使用预定义的语义模块编写业务规则，由用户或开发者在需要时进行配置和管理。需要注意的是规则引擎并不是一个具体的技术框架，而是指的一类系统，即业务规则管理系统。目前市面上具体的规则引擎产品有：drools、VisualRules、iLog等。规则引擎实现了将业务决策从应用程序代码中分离出来，接收数据输入，解释业务规则，并根据业务规则做出业务决策。规则引擎其实就是一个输入输出平台。drools 是一款

2025-04-04 18:39:34 1880 1

原创大数据电商数仓项目--实战（二）DWD层搭建

先将包含action字段的日志过滤出来，然后通过UDTF函数，将action数组“炸开”（类似于explode函数的效果），然后使用get_json_object函数解析每个字段。先将包含display字段的日志过滤出来，然后通过UDTF函数，将display数组“炸开”（类似于explode函数的效果），然后使用get_json_object函数解析每个字段。页面日志解析思路：页面日志表中每行数据对应一个页面访问记录，一个页面访问记录应该包含日志中的公共信息和页面信息。我是通过会话设置的，并不是永久的。

2024-10-15 19:11:20 1299 1

原创大数据电商数仓项目--实战（一）数据准备

Hive 引擎包括：默认MR ，tez ，sparkHive on Spark 既作为存储元数据又负责 SQL的解析优化语法是HQL语法Spark on Hive ：Hive只作为存储元数据，Spark 负责SQL解析优化语法是Spark SQL语法什么是拉链表：拉链表，记录每条信息的生命周期，一旦一条记录的生命周期结束，就重新开始一条新的记录，并把当前日期放入生效开始日期。

2024-09-27 19:29:02 2122 1

原创 Spark优化

Spark调优

2024-08-16 10:02:14 1667

原创 SparkStreaming

需要继承Receiver，并实现onStart、onStop方法来自定义数据源采集。

2024-08-16 09:21:03 2984

原创 SparkSQL

sparkSQL操作各种数据

2024-08-13 11:36:06 1223

原创 Spark内核

Spark2.x版本使用Netty通讯框架作为内部通讯组件。Spark 基于Netty新的RPC框架借鉴了Akka的中的设计，它是基于Actor模型，如下图所示：Spark通讯框架中各个组件（Client/Master/Worker）可以认为是一个个独立的实体，各个实体之间通过消息来进行通信。

2024-08-12 08:45:49 1240

原创大数据技术之Spark

Spark是一种基于内存的快速，通用，可扩展的大数据分析计算引擎RDD 叫做弹性分布式数据,是Spark中最基本的数据处理模型。

2024-08-10 11:15:41 941

原创 HBase

Hbase的功能和应用场景是什么？功能：能够实现实时分布式随机数据存储场景：大量的结构化数据，实时，随机，持久化存储Hbase的基本存储结构是什么？设计：分布式大量数据实时存储分布式内存【进程】+分布式磁盘【HDFS】实现：NameSpace：类似于数据库概念，访问表的时候必须加上NSTable：就是表概念，表是分布式的，一张表可以有多个分区Region，每个分区可以存储在不同的节点上。

2024-05-30 11:02:47 1774

原创大数据技术之Scala语言，只需一篇文章即可，教你学会什么是Scala，教你如何使用Scala

Scala的集合有三大类：序列Seq，集Set，映射Map，所有的集合都扩展自Iterable特质。对于几乎所有的集合类，Scala都同时提供了可变和不可变版本，可变集合可以在适当的地方被更新或扩展。这意味着你可以修改，添加，移除一个集合的元素。而不可变集合类，相比之下，永远不会改变。不过，你仍然可以模拟添加，移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合，同时使原来的集合不发生改变，所以这里的不可变并不是变量本身的值不可变，而是变量指向的那个内存地址不可变。

2024-05-28 17:45:14 7093

原创究极完整版！！Centos6.9安装最适配的python和yum，附带教大家如何写Centos6.9的yum.repos.d配置文件。亲测可行！

究极完整版！！Centos6.9安装最适配的python和yum，附带教大家如何写Centos6.9的yum.repos.d配置文件。亲测可行！

2024-05-16 13:09:05 1044

原创大数据队列Kafka

kafka内容学习

2024-03-11 15:59:37 1239 1

原创 Apache 辅助系统工具

概述flume是一款大数据中海量数据采集传输汇总的软件。特别指的是数据流转的过程，或者说是数据搬运的过程。把数据从一个存储介质通过flume传递到另一个存储介质中。核心组件source：用于对接各个不同的数据源sink: 用于对接各个不同存储数据的目的地（数据下沉地）channle：用于中间临时存储缓存数据运行机制flume本身是java程序，在需要数据采集的机器上启动agent进程agent进程里面包含了：source sink channel。

2024-01-25 16:02:24 1683

原创 jQuery (JavaScript)进阶使用

(元素).事件方法名1(要执行的功能);$(元素).事件方法名2(要执行的功能);

2024-01-25 16:01:26 1356

原创 Javaweb 服务

会话：浏览器和服务器之间的多次请求和响应，为了实现一些功能，浏览器可能会产生多次请求和响应，多次响应加在一起就称之为浏览器和服务器之间的一次会话会话过程中产生的一些数据，可以通过会话技术（Cookie和Session保存）。Cokkie：客服端会话管理技术，把要共享的数据保存到客户端，每次请求时，把会话信息带到服务器端，从而实现多次请求的数据共享。

2024-01-25 15:59:22 923

原创 Apache Shiro 安全框架

Realm域：Shiro从Realm获取安全数据（如用户、角色、权限），就是说SecurityManager要验证用户身份，那么它需要从Realm获取相应的用户进行比较以确定用户身份是否合法；也需要从Realm得到用户相应的角色/权限进行验证用户是否能进行操作；可以把Realm看成DataSource，即安全数据源/*** 自定义Realm 处理登录权限*/@Autowired@Autowired@Autowired/*** 授权*/@Override// 角色列表。

2024-01-25 15:54:56 2028

原创 Redis学习（linux）

Redis的安装分为windows版和linux版。此篇介绍linux版

2023-12-24 23:33:36 1175

原创网站流量日志分析

js和html页面耦合在一起不利于后续js维护把js单独提取变成一个文件然后通过src属性引入页面进行所谓解耦合一台服务器身兼多职压力过大降低服务器请求压力单独的去部署服务器专门用于采集数据的请求响应可能会产生跨域问题（限制js跨域的数据发送）以请求图片的形式把采集的数据拼接成为图片的参数发送到指定的服务器上去绕开js跨域问题。

2023-12-06 22:07:39 2010

原创如何解决nginx在记录post数据时中文字符转成16进制的问题

在遇到错误得时候，我们往往不知道该怎么搜索此类答案，我想大家应该都会把错误信息放在搜索引擎中搜索，关键字要随着搜索得到的信息从而不断变化，才能往根源得问题靠近。在搜索引擎给出的大量信息，要懂得抓取有用的信息，不能忽视已经给出问题答案的信息，即使信息比较久远。像阶段1得情况，我如果仔细阅读上面得解答信息，应该会很快得找到问题所在的根源。Nginx/* 这是十六进制字符表 *//* 这是ASCII码表，每一位表示一个符号，其中值为1表示此符号需要转换，值为0表示不需要转换 *//*?>=

2023-11-20 18:21:13 636

原创 Apache Impala

因此在安装impala的时候，需要使用rpm包来进行安装。impala 的配置目录为/etc/impala/conf，这个路径下面需要把 core-site.xml，外部命令是指不需要进入impala-shell交互命令行就可以执行的命令，可以在启动 impala-通过配置/etc/default/impala 中可以发现已经指定了 mysql 驱动的位置名字。在所有需要安装impala的节点上，因为impala需要引用hive的依赖包。服务并且配置好，是决定 impala 是否启动成功并使用的前提。

2023-11-06 21:18:51 775

原创 Hive的高级操作以及调优

2.1 概述:Hive 自带了一些函数，比如：max/min等，当Hive提供的内置函数无法满足你的业务处理需要时，此时就可以考虑使用用户自定义函数(UDF).根据用户自定义函数类别分为以下三种：一进一出聚集函数，多进一出countmaxmin一进多出如lateralviewexplore()编程步骤：继承org.apache.hadoop.hive.ql.UDF需要实现evaluate函数；evaluate函数支持重载；注意事项。

2023-10-31 18:53:14 259

原创数据仓库Hive

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。hive可以理解为一个将SQL转化为MapReduce的任务工具。

2023-10-28 17:48:01 185

原创 Hadoop高可用环境搭建文档

node03机器执行以下命令启动jobHistory。将第一台机器的安装包发送到其他机器上。node01机器查看hdfs状态。node02机器查看hdfs状态。第一台机器执行以下命令进行解压。node01机器执行以下命令。更改node02的rm2。第一台机器执行以下命令。第一台机器执行以下命令。第一台机器执行以下命令。第一台机器执行以下命令。三台机器上共同创建目录。第二台机器执行以下命令。三台机器执行以下命令。node02上面执行。node03上面执行。node03上面执行。node02上面执行。

2023-10-19 10:44:27 210

空空如也

hive启动报错nosuchmethod