培根芝士-CSDN博客

原创基于Docker部署M3U8流媒体

摘要：本文介绍基于Docker+Nginx-RTMP+Nginx搭建24/7循环直播流方案。通过FFmpeg将MP4文件转换为HLS(M3U8)格式，使用Docker部署nginx-rtmp容器进行流媒体转发，配置宝塔Nginx实现HTTP/HTTPS播放。关键步骤包括：环境准备（Docker/FFmpeg安装）、容器启动与目录权限设置、FFmpeg循环推流命令、Nginx播放配置及前端嵌入方法。方案支持性能优化（如使用-c:v copy降低CPU占用），并提供完整的流媒体测试与播放验证方法。（149字）

2026-01-23 11:32:22 430

原创把PP-OCRv5_server模型转换为OpenVINO格式

PP-OCRv5_server是百度飞桨推出的高精度OCR模型组合，包含文本检测（PP-OCRv5_server_det）和文本识别（PP-OCRv5_server_rec）两个模块，适用于服务器端部署。摘要介绍了从模型下载到转换部署的全流程：1）安装PaddlePaddle和OpenVINO工具包；2）从ModelScope下载模型；3）使用paddle2onnx将Paddle模型转为ONNX格式；4）通过OpenVINO工具将ONNX转换为IR格式（XML+BIN），支持动态输入尺寸和FP16压缩优化。

2026-01-23 11:26:02 302

原创 LMDeploy框架详解

LMDeploy是由上海AI Lab和OpenMMLab联合开发的开源大模型部署工具箱，提供从模型压缩到推理优化的全链路解决方案。其核心优势包括：1）高性能推理，吞吐量达vLLM的1.8倍；2）双引擎架构（TurboMind+C++/CUDA和PyTorch/Python）；3）支持多模态模型；4）先进的量化技术如AWQ、FP8等。主要功能涵盖模型转换、量化、分布式部署和服务接口支持，适用于生产环境与研究开发。通过持续批处理、动态算子优化等技术创新，显著提升大模型部署效率。

2026-01-21 15:44:29 636

原创解决DBeaver对PostgresSQL备份数据库时报错

DBeaver备份PostgreSQL时报错，原因是pg_dump版本(15.3)与服务器版本(16.11)不匹配。解决方法：1)下载安装PostgreSQL16；2)在DBeaver驱动管理中设置本地客户端路径为PostgreSQL16的安装目录(如C:\ProgramFiles\PostgreSQL\16\bin)；3)修改数据库连接的本地客户端配置为PostgreSQL16。确保DBeaver使用正确版本的pg_dump.exe执行备份操作即可解决问题。

2025-12-28 13:02:51 349

原创使用Scripting API获取CS2游戏数据

Scripting API文档（Scripting API - Valve Developer Community，主要针对 Counter-Strike 2 Workshop Tools 的 cs_script API）为开发者提供了强大的工具，用于创建自定义游戏模式、地图逻辑和事件处理。

2025-12-05 14:41:23 858

原创基于docker部署vllm运行Qwen3模型

本文介绍了使用Docker部署vLLM推理服务的详细步骤，支持Qwen3系列模型。主要内容包括：1) 拉取vLLM Docker镜像；2) 提供了Qwen3-14B-AWQ和Qwen3-VL-8B-AWQ-INT4两种模型的启动命令，包含端口映射、显存控制等关键参数；3) 给出了对应的Python测试代码示例，展示如何通过OpenAI兼容API调用模型进行文本生成和视觉内容分析；4) 详细解释了各项运行参数的含义，如GPU使用、模型精度、上下文长度等配置项。该方案可实现高效的模型推理服务部署。

2025-12-02 11:47:36 642

原创使用llm-compressor 对 Qwen3-14B 做 AWQ + INT4 量化

本文详细介绍了Qwen3-14B模型的AWQ+INT4量化流程。首先通过Conda创建Python3.10环境并安装PyTorch、vLLM等必要依赖。然后提供完整的量化脚本实现：加载原始模型和分词器，使用ultrachat_200k数据集校准，配置W4A16方案进行INT4量化，最后保存量化后的模型并测试生成效果。整个过程包括环境准备、GPU验证、量化参数配置、测试生成和模型保存等关键步骤，最终生成包含压缩权重的量化模型目录。

2025-12-02 11:20:39 376

原创使用 OpenVINO 对 Qwen3-14B 模型进行 INT4 量化

摘要：本文介绍了使用Optimum-Intel工具对Qwen3-14B大模型进行INT4权重量化的方法。通过optimum-cli命令可实现4-bit量化（默认int4_asym），其中--ratio参数控制80%层使用INT4、其余用INT8，--group-size设为128以平衡精度与效率。量化后的模型可通过OpenVINO GenAI加载，支持CPU/GPU/NPU设备运行。示例展示了如何用Python调用量化模型进行文本生成，并验证INT4量化对LLM性能的影响。该方法有效减小模型体积，同时保持推

2025-11-27 14:17:05 345

原创解决PyInstaller打包后ProcessPoolExecutor失效的问题

摘要：在Windows下使用PyInstaller打包的Python程序启动多进程时，子进程会重复执行主程序初始化逻辑。问题根源在于Windows的spawn机制会重新执行主程序入口代码。解决方案包括：1)在主程序入口调用multiprocessing.freeze_support()；2)显式设置启动方法为'spawn'。这些修改确保子进程能正确识别身份，跳过不必要的初始化，直接执行目标任务。

2025-11-27 14:13:35 365

原创基于 OpenVINO GenAI 运行Qwen3-14B模型推理

摘要：英特尔OpenVINOGenAI是专为生成式AI开发优化的工具库，支持在CPU、GPU等英特尔硬件上高效部署多模态应用。本文详细介绍Qwen3-14B-INT4-OV模型的安装、量化和推理流程，包括设备兼容性检查、推理性能指标（如TTFT首token时间）的测量方法，以及如何通过流式生成计算token吞吐量。实验显示该工具能有效简化大语言模型在英特尔平台上的部署，并提供详细的性能分析功能。（148字）

2025-11-12 10:41:56 310

原创 OpenWebUI本地开发指南

本文介绍了Open WebUI项目的开发环境搭建与部署流程。首先需准备操作系统和开发环境（Python 3.11+、Node.js 22.10+），然后克隆代码仓库。前端部分需配置环境变量、安装依赖并启动开发服务，后端建议使用Conda隔离Python环境后启动服务。文章还提供了跨设备联调方法，包括局域网访问配置和CORS白名单设置。最后给出了Linux和Windows系统下的Docker镜像编译脚本，包含端口映射、数据卷挂载等配置参数，支持项目容器化部署。

2025-11-12 10:27:57 403

原创将火山云TOS存储桶挂载到Linux服务器

摘要：本文介绍了使用Goofys和S3FS工具挂载TOS存储桶的详细步骤及注意事项。主要内容包括：1）安装Goofys/S3FS工具；2）配置密钥文件并执行挂载命令；3）验证挂载结果；4）常见问题排查方法。特别强调S3FS性能限制、多客户端协调问题，以及生产环境推荐使用API而非挂载方式。文中提供了完整的命令示例和关键参数说明，并指出TOS仅支持VirtualStyle访问方式。

2025-10-28 18:10:32 861

原创使用Optimum-habana对LLM模型训练推理

摘要：optimum-habana是连接Transformers/Diffusers库与Intel Gaudi AI加速器(HPU)的接口工具，支持单卡和多卡环境下的模型训练与推理。它提供已验证支持的多种主流模型架构（如BERT、GPT、Llama等）及任务类型（文本生成、问答等）。文档详细介绍了Docker环境搭建、依赖安装方法，以及单卡/多卡训练、LoRA微调和模型推理的具体配置参数，特别是针对大语言模型(如Llama-2 70B)的分布式训练优化方案。

2025-09-26 19:54:00 1179

原创统计用户的N日留存

N日留存率是衡量用户留存的关键指标，计算公式为指定日期新增用户中在N天后仍活跃的用户占比。与"最近N日活跃"不同，N日留存聚焦特定同期群在精确时间点的留存表现。SQL示例通过三步骤实现7日留存计算：1)识别用户首访日期；2)记录用户活跃日期；3)关联数据计算留存率。该方法能准确评估新用户7天后的留存情况，反映产品粘性。（147字）

2025-09-23 10:50:54 312

原创 Llama-Factory微调 Qwen2.5-VL-3B 模型

本文详细介绍了Qwen2.5-VL-3B多模态模型的LoRA微调全流程。首先说明硬件需求（3B模型约需8-12GB显存）和环境搭建步骤，包括创建虚拟环境、安装依赖项和下载模型。重点阐述了多模态数据集准备规范（JSON格式+图像目录）和数据集注册方法。推荐使用LoRA轻量级微调以降低显存需求，提供了命令行和WebUI两种训练方式及详细参数配置。最后介绍模型测试、导出方法和常见问题解决方案，特别强调数据质量、显存优化和模型兼容性等关键注意事项。

2025-08-21 19:57:01 1530

原创 LTM框架Letta

Letta是一个开源框架，用于构建具有长期记忆和高级推理能力的有状态AI代理。框架支持多种模型和数据库，安装后可通过环境变量配置LLM和嵌入模型。提供本地服务器运行和Web开发环境(ADE)，支持API接口管理代理，包括创建、查询和交互功能。兼容SQLite和PostgreSQL，支持Ollama等本地模型部署。开发者可通过REST API或Python客户端实现代理管理，适用于构建复杂的对话系统和智能应用。

2025-08-21 19:22:58 592

原创基于SIFT/ORB计算图像的旋转角度和缩放比例

文章摘要：本文介绍了通过特征点匹配计算图像间旋转角度的方法。使用SIFT或ORB算法提取特征点，BFMatcher进行匹配，再用estimateAffinePartial2D函数计算仿射变换矩阵，从中提取旋转角度和缩放比例。提供了完整的SIFT和ORB实现代码，并指出特征匹配质量、旋转角度范围和算法性能等注意事项。该方法适用于图像处理中的旋转检测，可根据实际需求选择不同特征提取算法。

2025-08-20 09:56:55 476

原创 Windows下搭建Ubuntu系统并部署Python环境

摘要：本文介绍了WSL安装配置全过程。首先通过PowerShell启用WSL并安装Ubuntu分发版，随后配置挂载目录权限。接着安装Python3.12及必要开发工具，创建虚拟环境并配置pip清华源。然后安装CUDA工具包验证环境，修改pip缓存路径。最后详细说明如何迁移WSL的ext4.vhdx文件到新位置，包括导出、卸载和重新导入等步骤。整个流程涵盖从基础环境搭建到深度学习工具链配置，并提供了关键配置文件的修改方法。

2025-08-20 09:54:02 529

原创 Qwen2.5-VL-3B模型4bit推理

阿里巴巴推出新一代多模态模型Qwen2.5-VL，支持图像、文本和视频理解，具备更强的代理决策能力。该模型采用优化架构，支持结构化输出，在文档图表理解和视频分析任务中表现优异。提供3B到72B多种规模版本，其中3B模型经量化后可在8GB显存设备运行。文章详细介绍了模型特性、硬件要求、部署方法及输入格式限制，并提供了4-bit量化推理的代码示例和显存优化建议。

2025-08-06 00:37:15 1459

原创使用BART模型和T5模型实现文本改写

摘要：BART和T5是两种主流的预训练语言模型，均采用编解码架构。BART结合BERT的双向编码和GPT的自回归解码，通过文本破坏还原任务预训练，适用于生成和理解任务。T5提出统一文本到文本框架，所有任务均转换为text-to-text形式，采用span掩码预训练。两者都支持多种下游任务，BART更侧重生成，T5强调任务统一性。中文场景下可通过微调实现文本改写等功能，典型实现使用HuggingFace的transformers库加载预训练权重进行推理。

2025-08-01 20:08:30 1079

原创 Android使用MediaProjectionManager获取游戏画面和投屏

Android系统通过MediaProjectionManager实现屏幕录制和截屏功能，需先获取用户授权。主要步骤包括：获取管理器实例、创建权限请求Intent、处理授权结果并获取MediaProjection对象。关键是通过createVirtualDisplay()创建虚拟显示，需指定屏幕参数和渲染目标Surface。使用注意事项包括版本适配、权限管理、资源释放等，特别在Android14+需注意令牌的单次使用限制。该功能为开发者提供了灵活的屏幕内容捕获方案，可用于录制、截图等场景。

2025-08-01 20:01:05 807

原创使用 Canvas 替代＜video＞标签加载并渲染视频

本文提出了一种基于WebGPU+Canvas2D的高性能视频渲染方案，解决传统video标签首帧延迟问题。核心思路是将视频解码与渲染分离：隐藏的video标签负责解码，WebGPU通过importExternalTexture获取视频帧纹理，配合Canvas2D实现高效渲染。方案采用requestVideoFrameCallback优先的帧同步机制，动态调整画布尺寸，并复用WebGPU对象（纹理、绑定组等）提升性能，最终构建出跨平台、低延迟的视频播放管线。关键实现包括视频帧回

2025-07-29 23:51:02 646

原创 YOLOv11.pt 模型转换为 TFLite 和 NCNN 模型

鉴于 Windows 的兼容性问题，强烈建议使用 Google Colab，因为它提供 Linux 环境，预装 CUDA，兼容 ai_edge_litert。只需上传模型和脚本，安装依赖即可完成转换。

2025-07-29 23:48:38 1069

原创 Electron将视频文件单独打包成asar并调用

本文将介绍如何将视频文件打包到单独的asar包中并让Electron应用正常调用。首先调整项目结构，将视频文件单独存放；然后使用asar命令打包视频文件；接着修改forge.config.js配置，设置asar选项并忽略视频目录；在主进程中注册自定义协议处理asar文件资源；最后在渲染进程中通过注册的协议引用视频文件。关键步骤包括asar打包、协议注册和CSP策略设置，确保视频资源能通过app://协议正常访问。

2025-07-29 23:44:56 459

原创图像特征检测算法ORB

ORB（Oriented FAST and Rotated BRIEF）是一种在计算机视觉领域广泛应用的特征检测与描述算法。

2025-06-19 18:00:49 761

原创图像特征检测算法SIFT

SIFT（Scale - Invariant Feature Transform，尺度不变特征变换）是一种计算机视觉领域的特征提取算法，具有重要的地位和广泛的应用。

2025-06-19 17:52:40 1109

原创图像特征检测算法SuperPoint和SuperGlue

SuperPoint 是一个自监督的全卷积神经网络，用于提取图像中的兴趣点及其描述子。它在 2018 年由 Magic Leap 提出，通过在合成数据集上预训练一个基础检测器 MagicPoint，然后利用同胚适应技术对真实图像数据集进行标记，从而得到一个增强的检测器 SuperPoint，使其在真实世界图像上具有可靠性。

2025-06-17 19:34:52 1299

原创 Python去除图像背景

rembg 是一个开源的 Python 库，专门用于去除图像背景，它利用深度神经网络能够准确地识别并去除图像背景，使用户无需进行复杂的手动编辑，只需几行代码即可获得专业效果。Rembg 基于 U2-Net 架构，有多种架构修改和经过测试的方法以提供最佳结果，还提供对 GPU 安装的访问以实现更快的处理。

2025-06-17 19:14:52 344

原创图像特征检测算法

图像特征检测是计算机视觉的基础技术，用于提取图像中的关键信息。传统算法包括SIFT（高鲁棒性但计算慢）、SURF（SIFT的加速版本）、ORB（实时性强）、Harris角点检测（简单高效）和FAST（极速检测）。边缘检测算法如Canny可提取连续轮廓，HOG和LBP分别适用于形状和纹理特征。深度学习方法如CNN和SuperPoint通过端到端学习实现更高精度。算法选择需权衡速度、精度和应用场景，当前趋势是深度学习主导、轻量化部署和多模态融合。传统与深度学习方法正在融合，以构建更高效的视觉系统。

2025-06-17 19:12:20 1103

原创使用 LSTM/GRU 预测设备异常的模型

LSTM 和 GRU 都被广泛应用于自然语言处理、时间序列预测、语音识别等领域。LSTM 由于其强大的长期依赖建模能力，在需要处理长序列数据时通常表现更好，但计算成本较高。而 GRU 在一些对实时性要求较高或计算资源有限的场景下，由于其结构简单、计算效率高，可能会成为更优的选择。

2025-05-16 16:40:56 1239

原创使用 swift 微调 Qwen3-4b 模型

Qwen3 推荐使用 Axolotl、UnSloth、Swift、Llama-Factory 等训练框架来进行 SFT、DPO、GRPO 等微调模型的处理。魔搭社区提供的 ms-swift 框架，支持 500 多种大模型与 200 多种多模态大模型的训练、推理、评测、量化与部署，涵盖众多知名模型。它还汇集了多种轻量化训练技术及人类对齐训练方法，并支持使用 vLLM 和 LMDeploy 进行加速，同时运用多种技术对大模型量化，且提供了基于 Gradio 的 Web-UI 界面及丰富最佳实践。

2025-05-09 15:00:20 1126

原创 Optimum详解

Optimum 是 Hugging Face 提供的 Transformers 和 Diffusers 的扩展库，旨在帮助用户在目标硬件上以最高效率训练和运行模型，同时保持易于使用的特性。

2025-05-08 18:26:18 1574

原创基于 MeloTTS.cpp 的轻量级的纯 C++ 文本转语音（TTS）库

是一个轻量级的纯 C++ 文本转语音（Text-to-Speech，TTS）库，由 MyShell.ai 开发并发布。它基于 MeloTTS 项目，支持多种语言的语音合成，包括英语、中文（混合英语）以及即将支持的日语等。

2025-04-28 14:32:36 1814

原创 electron-updater实现自动更新

electron-updater 是一个专为 Electron 应用设计的自动更新工具，能够帮助开发者轻松实现跨平台的自动更新功能。它支持 Windows、macOS 和 Linux 系统，通过简单的配置即可集成到 Electron 应用中，自动检查应用的最新版本并在后台完成更新。electron-updater 提供了灵活的更新策略，比如自动下载更新、静默安装，以及在下次启动时应用更新，从而确保用户始终使用最新版本的应用程序。

2025-04-24 19:31:20 1416

原创 Electron打包支持多语言

在项目的构建资源目录（如 build 或 public）中，创建多个许可文件，并在文件名中添加语言代码后缀。：指定安装向导支持的语言列表。例如，["zh_CN", "en_US"] 表示只显示简体中文和英文。打包应用后，安装向导会显示语言选择对话框，且只包含简体中文和英文选项。选择语言后，安装向导会根据选择的语言加载对应的许可文件。license_zh_CN.txt（简体中文）：设置为 true，表示创建多语言安装包。：设置为 true，显示语言选择对话框。license_en.txt（英文）

2025-04-15 15:35:39 883

原创提取app.asar中的资源

通过以上步骤，你可以成功提取 .asar 文件中的资源。如果需要进一步操作或修改文件，可以在解压后进行编辑，完成后可以重新打包为 .asar 文件。首先，确保已安装 Node.js 和 npm。如果 .asar 文件被加固或加密，可能需要额外的工具（如 asar-plus）来解压。确保在解压前备份原始 .asar 文件，以免误操作导致数据丢失。

2025-04-15 10:24:35 1765

原创 electron-builder参数详解

electron-builder 是一个用于打包和构建 Electron 应用的工具，支持 macOS、Windows 和 Linux 平台，并提供了丰富的参数配置选项。

2025-04-14 21:43:50 2150

原创解决Server doesn‘t support Accept-Ranges问题

当启用时，更新程序会通过多个分段请求（Range: bytes=x-y）来下载更新内容，而不是一次性下载整个文件。如果服务器不支持多段请求（例如某些服务不支持 Content-Type: multipart/byteranges），则需要禁用此选项。这种方式通常通过 blockmap 文件实现，blockmap 文件记录了文件的分块信息（如哈希值和大小），用于确定需要下载的更新内容。差异更新通过对比新旧版本的文件内容，只下载发生变化的部分，从而减少更新包的大小和下载时间。

2025-04-11 11:03:29 680

原创使用multiprocessing实现进程间共享内存

在 Python 中，可以使用多种方法来实现几个进程之间的通信。

2025-03-14 20:45:28 785

原创使用 PresentMon 获取屏幕帧率

PresentMon是一个用于捕获和分析Windows上图形应用程序高性能特性的工具集，最初由GameTechDev开发，现由英特尔维护和推广。PresentMon能够追踪关键性能指标，如CPU、GPU和显示器的帧持续时间和延迟等，并支持多种图形API（如DirectX、OpenGL和Vulkan）以及不同的硬件配置和桌面与UWP应用程序。

2025-03-13 20:59:50 1785

基于Bert模型实现文本情感分析

本代码使用Bert模型，我们可以有效地检测文本情感分析。 Bert通过在大规模文本语料库上进行无监督预训练，学习语言的通用特征。主要训练任务包括masked language model（MLM）和next sentence prediction（NSP）。在MLM任务中，随机掩盖输入句子中的一些单词，然后让模型预测这些被掩盖的单词，使模型能够理解单词之间的上下文关系；NSP任务则是让模型判断两个句子是否是连续的，帮助模型理解句子之间的逻辑关系。在预训练完成后，Bert可以根据具体的NLP任务进行微调。通过对预训练模型进行进一步的训练，使其适应情感分析任务。在微调过程中，会根据任务的特点添加相应的输出层，并对整个模型进行端到端的训练。

2025-06-23

基于RoBERTa模型实现AI生成文本检测

本代码使用RoBERTa模型，我们可以有效地检测AI生成的文本。 RoBERTa（Robustly optimized BERT approach）是BERT的一个优化版本，通过对大量数据进行预训练，它在各种自然语言处理任务上都取得了显著的性能提升。主要步骤：包括数据预处理、模型和优化器的初始化、训练过程、验证与早停机制以及评估函数。

2024-12-08

基于ViT模型实现相似图像检索

本代码基于深度学习实现图像检索，它利用Vision Transformer（ViT）模型来提取图像特征，并执行相似度比较以找到最匹配的图像。系统的核心功能是通过比较查询图像与数据库中图像的特征向量，来检索出与查询图像最相似的图像。核心组件预处理：图像在送入模型之前会经过一系列的预处理步骤，包括调整大小、中心裁剪、转换为张量以及归一化。特征提取：使用预训练的Vision Transformer模型（vit_b_16）来从预处理后的图像中提取特征向量。这里假设模型的输出可以作为图像的特征表示。余弦相似度计算：系统使用余弦相似度来衡量两个特征向量之间的相似度，这是一种常用于比较向量相似度的方法。数据库构建：系统会遍历指定的数据集目录，对每个图像文件执行特征提取，并将特征存储在内存中以便于后续检索。图像检索：给定一个查询图像，系统会计算其特征与数据库中每个图像特征的相似度，并返回最相似的图像列表。

2024-11-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

基于Bert模型实现文本情感分析

基于RoBERTa模型实现AI生成文本检测

基于ViT模型实现相似图像检索

iOS生物识别FaceID&TouchID

iOS生成二维码 QRCodeView

IOS环形进度条

空空如也