爱刘温柔的小猪-CSDN博客

原创构建高性能Canvas渲染引擎：在线PPT编辑器的复杂交互技术实现

本人不是专业前端，在做PPT WEB端编辑功能时，恶补了一些知识和参考了一些开源项目大神的技术实现，边实践边写出本篇文章。如有更好的实现方案和优化点，欢迎大家指正和讨论。

2025-11-26 10:29:11 335

原创企业级混合存储架构：MySQL + MinIO 混合存储实践

因此本项目采用了MySQL存储结构化元数据、MinIO存储大文件的混合架构，不仅解决了存储成本问题，还实现了优异的性能表现，以及实现双向校验、动态安全迁移等功能。混合存储架构的核心思想是"数据分层存储"——根据数据的特性、访问频率和业务需求，将不同类型的数据存储在最适合的存储系统中。因此，作为总结，屏蔽掉项目的业务信息和核心技术细节，将混合存储部分掰开给大家讲讲，并争取让大家拿来即用，或者参考实现。到此，混合存储的核心思想和设计，以及不包含业务相关的完整实现已经全部说完了，调优部分也提供出来供大家参考！

2025-11-10 21:00:00 940

原创硅基流动 API 中转服务：完全兼容 OpenAI API 格式，转发到硅基流动

为了更好地控制 API 调用、添加监控、缓存等，以及自定义一些的返回值信息，因此开发了这个轻量级的中转服务。

2025-10-11 11:39:15 1458

原创基于 bcrypt 和会话管理的轻量级认证系统设计

安全性高: 使用 bcrypt 哈希和安全令牌生成实现简单: 核心代码不到 500 行可扩展性强: 支持多种验证策略和安全增强性能良好: 包含自动清理和索引优化易于集成: 提供中间件和装饰器支持这个认证系统适用于中小型应用或需要定制化认证逻辑的场景。在实际使用中，你可以根据具体需求调整安全策略、会话过期时间和验证严格程度。核心代码都放上去了，基本可以开箱即用或者参考！完结撒花★,°.°★。

2025-09-30 14:56:58 823

原创 Python 基于 MinIO 的文件上传服务与图像处理核心实践

本文介绍了基于 MinIO 的文件上传服务实现方案，涵盖了从架构设计到具体实现的各个环节。灵活的配置管理：通过环境变量实现不同环境的配置隔离自动化部署：存储桶自动创建和权限配置多层安全验证：文件类型、大小、内容完整性验证高性能处理：异步处理和线程池优化可靠性保障：重试机制和错误处理这套方案在生产环境中表现稳定，能够满足高并发场景下的文件上传需求。通过合理的架构设计和安全防护，为用户提供了安全、高效的文件上传体验。

2025-09-25 11:45:28 508

原创 openai-agent使用本地模型并进行流式输出

执行fix_logprobs.py脚本，来替换底层.venv/lib/site-packages/agents/models/chatcmpl_stream_handler.py文件中的逻辑，让流式兼容正常的模型api。如果你是用的openai模型，直接使用框架带的流式输出Runner.run_streamed流式方法即可。openai-agent原生兼容openai模型，当我们使用其他模型，例如vllm私有部署的，或者给硅基流动的模型时，需要进行额外处理。我们一会儿就会修改该文件，所以先做备份吗。

2025-08-14 19:00:00 727

原创 python向mysql插入大数据时的错误

或者。

2025-08-06 10:41:07 426

原创 java实现Excel转pdf(完美格式、不使用商业库Aspose)

本文介绍了一种基于SpringBoot+Python的Excel转PDF方案，适用于Windows环境。主要内容包括：1）环境配置需安装JDK1.8和Python3.11；2）Python脚本使用win32com调用Office原生功能实现转换，包含文件验证、线程安全处理和错误处理；3）SpringBoot服务层通过调用Python脚本实现转换功能，包含文件上传、路径处理和结果返回。该方案提供了完整的代码实现，包括Python脚本核心转换逻辑和Java服务层调用示例，可作为商业库Aspose的替代方案。

2025-07-30 20:15:00 1183

原创创建Springboot的服务管理脚本

因此做一个完整的 Bash 脚本，可以用来管理你的xxxx.jar 应用程序。这个脚本提供了启动、停止、重启和查看状态的功能，各位把脚本中的jar名和路径换成自己的就可以直接使用。有时一些临时测试的程序，如果每次都手动java -jar太麻烦了，而且不便于管理状态。

2025-07-03 18:30:00 380

原创 FastMCP框架进行MCP开发：（三）从SSE升级到SteamableHTTP

在MCP（Model Context Protocol）中，Streamable HTTP和SSE（Server-Sent Events）都是用于实现客户端与服务器之间通信的传输机制。然而，它们在设计、功能以及性能表现上有着显著的区别。

2025-06-25 22:00:00 1429

原创 FastMCP框架进行MCP开发：（二）图书馆座位查询与预约MCP-Server

FastMCP 是一个基于MCP协议构建的快速开发框架，旨在简化创建高效、可扩展的服务端程序的过程。它封装了许多底层细节，使得开发者可以专注于业务逻辑的实现，而不需要过多关心网络通信、并发控制等方面的问题。易用性：提供了简洁的API接口，易于上手。高性能：优化了性能，适合高并发场景。扩展性强：支持自定义配置和服务功能扩展。调用 /available 接口，传入楼宇、日期、时间段等参数。返回空闲座位列表。

2025-06-20 21:45:00 561

原创 FastMCP框架进行MCP开发：（一）基础环境搭建及测试

命令会基于当前所在目录创建一个虚拟环境，默认生成一个名为 .venv 的文件夹。也就是说，你在哪个目录下运行这条命令，就会为该目录创建一个独立的虚拟环境。uv是一个由 Rust 编写的高性能 Python 包管理工具，MCP要求借助uv进行虚拟环境创建和依赖管理。1、首先window中要有python环境，没有的自己安装一下，这部分很简单就不多赘述。这里的mcp-test就是项目名，也是文件夹的名。

2025-06-19 19:15:00 696

原创快速运行Dify前端，无需搭建后端环境

当我们需要对Dify的前端进行定制化修改，但又不希望花费时间去搭建Python环境、沙箱服务及其他中间件时，我们可以选择仅运行前端并直接连接到已经私有化部署好的Dify后端API。这种方式能够让我们专注于前端代码的调整，而无需担心后端服务的配置问题。

2025-06-07 14:00:00 753

原创 dify官方离线安装打包插件脚本，改造成ubuntu或者debain系统可用

使用docker纯内网部署的dify1.0+版本，必须进行离线安装插件。官方只提供了centos版本的，因此改造一下官方脚本，变成ubuntu或者debain系统可用。

2025-06-06 17:30:00 586

原创利用k6脚本编写大模型安全性验证工具

本文介绍了如何使用K6压力测试工具编写脚本，以验证大模型对敏感和危险问题的规避能力。脚本通过加载包含大量提问的JSON数据集，向指定的API发送请求，并分析模型回答中是否包含预定义的敏感词汇。测试结果将记录在日志文件中，便于后续分析模型的安全性能。该方案旨在通过自动化测试，确保大模型在处理敏感内容时的安全性和合规性。

2025-05-22 17:09:45 336

原创 Qwen3多方位评测

结论，针对这些场景：上下文理解、任务编排、工具调用、数据要素抽取等环节，Qwen3-32B已接近DeepSeek-R1。Qwen3-235B-A22B排版最优，32B略逊于DeepSeek-R1，优于Qwen2.5-72B。Qwen3-32B任务拆解能力优于Qwen2.5-72B，接近DeepSeek-R1。时间要素解析：Qwen3-32B与DeepSeek-R1并列最优。Qwen3-32B对绝对时间语境理解优于Qwen2.5-72B。实体抽取：Qwen3-32B在Dense模型表现更稳定。

2025-05-20 18:45:00 722

原创 linux中Conda环境完整迁移方案

源机器和目标机器安装的Conda路径必须创建完全相同。例如-源机器：/home/cloud/anaconda3，目标机器也一定是：/home/cloud/anaconda3。

2025-05-19 17:02:39 891

原创 Redis+Caffeine构造多级缓存

Caffeine是一款基于Java 8的高性能、灵活的本地缓存库。它提供了近乎最佳的命中率，低延迟的读写操作，并且支持多种缓存策略，号称本地缓存之王。核心特性Caffeine的底层数据存储采用ConcurrentHashMap。因为Caffeine面向JDK8，在jdk8中ConcurrentHashMap增加了红黑树，在hash冲突严重时也能有良好的读性能。Caffeine采用了先进的缓存淘汰算法，如Window TinyLfu，以提供极高的缓存命中率和低延迟的读写操作。

2025-05-12 15:01:25 1022 2

原创 Linux从零搭建Dify智能体平台（包含网络代理、docker安装、docker镜像地址设置）

【代码】Linux从零搭建Dify智能体平台（包含网络代理、docker安装、docker镜像地址设置）

2025-03-14 17:23:50 1139

原创 VLLM多卡并行优化策略

多卡并行方式，分为张量并行（Tensor Parallelism）和数据并行（Data Parallelism）。VLLM多卡并行主要依赖实现模型分布式推理。因此我们采用这种方案。

2025-03-01 16:45:00 5268 3

原创 Java不用模型，直接实现中文分词（HanLP）

/ 动态增加CustomDictionary.add("攻城狮");// 强行插入CustomDictionary.insert("白富美", "nz 1024");// 删除词语（注释掉试试）// CustomDictionary.remove("攻城狮");System.out.println(CustomDictionary.add("单身狗", "nz 1024 n 1"));System.out.println(CustomDictionary.get("单身狗"));

2025-02-28 18:45:00 1669

原创 DeepSeek蒸馏版模型VLLM部署方案

CUDA <12.1需使用旧版Python（3.10）和vllm==0.3.2。CUDA 12.4需搭配更高版本Python（3.11）和默认vllm。

2025-02-24 10:09:21 1140

原创 SpringBoot中SSE流式输出中止的核心代码

在大模型会话中，会有一个功能是停止生成功能。这个功能如果在前端实现，既取消监听后端的流式返回事件，会导致后端日志中报错连接中断等错误。

2025-02-21 15:31:45 1521 2

原创 springboot使用Redis发布订阅（Pub/Sub）实战

Redis 发布/订阅是一种消息传模式，其中发送者发送消息，而接收者（订阅者）接收消息。传递消息的通道称为channel。例如下图的工流程，当有新消息通过 PUBLISH 命令发送给频道 channel1 时，这个消息就会被发送给订阅它的三个客户端。

2025-01-22 19:30:00 1416

原创大模型基础环境部署之二：安装CUDA（详细实操版）

在完成 Nvidia 驱动的安装之后，接下来进行 CUDA 的安装以及版本确认。

2024-12-06 16:50:50 966

原创随机查询若干数据，并根据全部数据的点击量排序的核心代码

需求：随机展示六条帖子，并把这几条帖子的热度按照总的点击量进行分类，在全部点击量排前100的帖子为高热，100到1000名为热，1000到5000为火…也就是说，我需要随机查询六条数据，并得到这六条数据的点击量在全部数据的点击量中的排序位置。

2024-09-14 21:30:00 361

原创大模型基础环境部署之一：安装 Nvidia 的驱动（详细实操版）

如果该命令没有输出结果，则表示 nouveau 已被禁用。如果有输出结果，则需要执行以下步骤来禁用 nouveau。完成上述步骤后，系统应该已经满足了安装 Nvidia 驱动的前置条件。可以继续进行后续的安装步骤。为了使更改生效，需要重新生成 kernel initramfs。完成以上步骤后，需要重启系统以使更改生效。然后继续安装 libc6-dev 和 libc-dev 软件包。

2024-08-27 20:15:00 963

原创 Spring的包扫描路径之外获取Bean

建议只在必要时使用SpringContextUtil，并且考虑是否有其他方式可以实现相同的功能，例如通过使用@Import注解将类导入Spring容器，或者使用事件和监听器来解耦组件之间的依赖。因为我们自己写的这个工具类，其实是破坏依赖注入原则的，除非迫不得已，不然还是遵循Spring的原则来开发比较好。完结★,°.°★。

2024-08-05 21:45:00 541 2

原创文件流转MultipartFile，不使用MockMultipartFile的方式

MockMultipartFile 是一个用于测试的模拟类，通常在单元测试或集成测试中模拟 MultipartFile 的行为。它属于 Spring 框架的测试包 org.springframework.mock.web 中的一部分，不应该在生产环境中使用。因此我们采用实现MultipartFile接口类的方式，自己实现转换逻辑。

2024-05-30 21:30:00 2147

原创 SELF-RAG论文全流程阅读解析

作者为了节省成本，提出了一个的方法：写一个标注反思token的例子，然后把自己整理好的所有的自己领域相关的训练语料通过GPT4的API，让GPT4根据例子来进行插入反思token，然后把GPT4吐出来的训练语料+标注好的反思token作为完整的数据集，灌输给自己的M生成模型去学习，学习GPT4是怎么生成这些token的。看似很合理，但是有个问题。从官方的这个算法推理图中也可以看出，SELF- RAG中存在了两个模型，其中评判模型C的用途是为了构建生成模型M所需要的训练数据，当生成模型训练完成后，在。

2024-05-21 19:00:00 1911

企业版微信小程序申请流程.docx

bootstrap-fileinput.rar

HttpRequest.java

AesCbcUtil.java

augment(标签-vscode)