- 博客(176)
- 收藏
- 关注
原创 使用 Frp 同时实现 HTTP 和 HTTPS 内网穿透
Frp 是一个专为内网穿透设计的高性能反向代理应用。frps:部署在公网服务器上的服务端frpc:部署在内网客户端上的客户端程序它支持 HTTP、HTTPS、TCP、UDP 等多种协议,非常适合开发调试、本地 AI 服务开放、微信小程序联调等场景。功能是否支持说明同时支持 HTTP 和 HTTPS✅同一域名同时转发✅使用指定同一个域名本地无 HTTPS 也能启用公网 HTTPS✅可通过 Nginx 中转或 SSL 终结。
2025-04-25 19:45:00
1402
原创 Nginx 从 0 到 1 配置 HTTPS:实战指南(含 Certbot 自动签发)
为网站配置 HTTPS 是保障用户数据传输安全、提升用户信任感的重要手段。本文将手把手带你完成 Nginx HTTPS 配置,包括域名准备、证书申请、Nginx 配置及自动续期等关键步骤。
2025-04-25 09:30:00
352
原创 Nginx 路径反向代理实战:多服务分发配置与排错指南(CentOS 环境)
Nginx 是微服务架构中轻量且强大的反向代理网关工具。通过合理配置路径映射和 Host 匹配机制,我们可以轻松实现多服务转发、高性能分流以及安全隔离。本案例中不仅讲解了路径级转发的配置方法,还深入剖析了调试与 SELinux 权限问题,帮助你快速构建稳定可控的网关系统。
2025-04-24 20:00:00
372
原创 MySQL 数据库磁盘损坏应急恢复实战指南:修复、初始化与账户重建
熟悉应急启动技巧能在只读模式下导出数据并初始化环境掌握mysql.user表结构,手动恢复 root 用户权限善用配置文件my.cnf与操作系统工具分析磁盘与权限问题一次正确、快速的恢复,不仅避免数据丢失,还能帮助团队赢得关键的救援时间。如你有其他更复杂场景(如.ibd恢复、GTID 重建、主从复制恢复),欢迎留言或联系我继续深入分享。是否需要我帮你生成一份适配你 CSDN 发布格式的 markdown 版本?或者直接整理为 PDF?
2025-04-24 09:30:00
954
原创 用 Firebase 和 WebRTC 快速搭建一款浏览器视频聊天应用
在现代 Web 应用中,实时音视频通信变得越来越普遍。本文将通过一个简洁实用的示例,带你一步步搭建一个基于的浏览器视频聊天应用,帮助你理解 WebRTC 的核心通信机制以及如何借助 Firebase 进行信令传输。
2025-04-23 19:45:00
634
原创 开源 RTC 技术栈全解析:打造实时音视频通信的数字人底座
RTC 是 Real-Time Communication 的缩写,意为实时通信。低延迟:毫秒级数据交互;双向传输:通常为 P2P 或通过服务端中继;音视频及数据同步传输:实现完整交互能力。在数字人、直播互动、在线教育、协同办公、远程医疗等领域中,RTC 的作用至关重要。开源 RTC 技术的成熟,让构建低延迟、高交互的实时通信应用变得更加可控和高效。通过合理选择协议栈和组件,你可以为数字人直播、语音聊天室、在线教育等场景提供强大的通信能力。
2025-04-23 09:15:00
1240
原创 从零实现一个 Spring Boot 3 自定义 Starter:自动配置不生效的那些坑
本文介绍了在 Spring Boot 3 中封装自定义 Starter 的方法。作者在开发过程中遇到自动配置类失效的问题,经过研究发现 Spring Boot 3 已弃用 spring.factories,引入了新的 AutoConfiguration.imports 注册机制。文章详细讲解了如何使用 @AutoConfiguration 注解、正确注册自动配置类、验证配置是否生效,以及最小可用的 Starter 项目结构,并提供了常见问题排查清单和总结关键点。
2025-04-22 20:00:00
898
原创 基于 WebRTC + Pion + HeyGem.ai 实现可互动的数字人系统
通过本文提供的技术模型和实例,你已经能很方便地用 WebRTC + Pion + HeyGem.ai 实现一个可以被语音调用、自动生成声音和影像的数字人完整连通系统。如果需要我帮你完全写出这套 demo 程序,可以指定需要部分(前端、Pion、HeyGem 接入),我可以给出完整源码和启动方案。
2025-04-22 09:00:00
2366
原创 Charles 安装与使用详解:实现 App 与小程序 HTTPS 抓包
Charles 是一款基于代理的网络抓包工具,支持 HTTP/HTTPS、WebSocket 等协议,能实时拦截、查看、修改请求与响应。支持 HTTPS 解密支持修改请求(断点调试、重放)支持手机代理抓包(iOS/Android)支持 WebSocket 抓包Charles 是开发调试过程中不可或缺的网络抓包利器,尤其在移动端调试中帮助巨大。通过正确安装证书、配置代理、设置解密域名,即可实现 HTTPS 流量透明可视化。
2025-04-15 20:48:18
2249
原创 MySQL 数据库备份和恢复全指南
MySQL 是一款常用的开源数据库系统,在日常运维中,数据备份和恢复是系统管理的重要一环。本文将细致介绍 MySQL 两大备份方案——mysqldump和XtraBackup,包括备份方式、恢复步骤、定时脚本、远程备份和常见问题处理方案。
2025-04-15 20:28:47
448
原创 MCP - 使用 BlenderMCP 让 Claude AI 控制你的 Blender 模型创作
BlenderMCP 打通了 AI 与 3D 工具之间的壁垒,使得通过 Claude 自然语言即可进行场景构建、模型控制和素材管理等操作,大幅度简化建模流程。无论是个人创作、游戏原型设计还是团队协作,这套流程都值得你体验一番。uv。
2025-03-30 13:15:40
2624
5
原创 使用 Helm 在 Kubernetes 上部署高可用的 Dify 系统
Dify 是一个功能强大的开源 LLMOps 平台,虽然官方提供了基于 `docker-compose` 的部署方式,但在生产环境中,我们通常需要具备可扩展性、高可用性和容错性,这些正是 Kubernetes 所擅长的,于是开源一个 dify-chart 项目,实现基于 `Helm` 在 Kubernetes 上的高可用部署。dify-chart 项目是基于 `Helm`,将 Dify 的 `docker-compose.yaml` 和 `.env` 配置转换成 Kubernetes 环境下脚本。
2025-03-28 13:41:32
1921
3
原创 Helm YAML 模板语法详解(values.yaml + templates)
Helm 的 YAML 语法基于 Kubernetes 的 YAML 配置文件,但在此基础上引入了 **Go Template 模板语法**,使得配置更灵活、参数化程度更高。以下是对 Helm 的 YAML 文件结构和语法的详细介绍。
2025-03-25 12:00:00
937
原创 Helm 全面介绍:Kubernetes 的包管理器
Helm 是 Kubernetes 的包管理工具,类似于 Linux 的apt或yum。管理 Kubernetes 应用的安装、升级、回滚等生命周期封装复杂的 Kubernetes YAML 配置文件成一个个可复用的“包”(称为 Chart)通过变量模板化部署,提高灵活性和复用性通过service:port: 80Helm 是 Kubernetes 下 DevOps 工程师的“利器”,它极大简化了复杂应用的部署、升级与维护。
2025-03-25 10:00:00
789
原创 利用 Patroni + etcd + HAProxy 搭建高可用 PostgreSQL 集群
etcd 集群etcd 作为分布式键值存储,为 Patroni 提供集群状态、元数据存储与服务发现功能。本例中,我们使用 3 个 etcd 节点构建一个高可用的 etcd 集群。Patroni 管理的 PostgreSQL 集群Patroni 通过监控 PostgreSQL 实例的状态,并利用 etcd 作为一致性存储,实现主从切换与故障恢复。这里我们部署 3 个 Patroni 节点,每个节点内嵌一个 PostgreSQL 实例。HAProxy 负载均衡器。
2025-03-25 08:00:00
711
原创 Dify - 部署高可用私有化系统指南
文件中配置了 Dify 部署的总体结构,包括:几个 Dify 自身工程(api、web、 work、sandbox等),还有 Dify 的一些依赖(nginx、PostgreSQL、Redis、罗列了各类向量数据库),具体结构可以参考。无论是多节点的服务组件,还是高可用的底层存储系统,均能确保在高并发场景下稳定运行。可以部署多台 Docker 服务,内部使用域名、代理、nginx负载,需要注意修改 ssrf_proxy 配置。文件给出了一个单机环境部署,如果私有化高可用部署,我们可以在这个基础上进行修改。
2025-03-24 23:07:33
2465
7
原创 OmniParser:安装、测试与原理剖析
如何让 AI 智能控制电脑和手机?首先要让 AI 模仿人理解设备屏幕的内容,微软开源的 **OmniParser** 是一个专为图文信息解析任务设计的多模态模型,它支持图标检测、图标描述(Caption)、OCR 区域校验等任务,集成了 YOLOv8 和 FLORENCE/BLIP2 等主流视觉模型,协助 AI 看懂屏幕,从而进一步执行智能操作。本篇博客将从 **安装配置、简单测试、原理解构** 三个方面,全面解析 OmniParser 的使用与原理。
2025-03-24 08:00:00
1102
4
原创 SSRF 攻击与防御:从原理到落地实践
是一种常见的Web安全漏洞。扫描内网:探测企业内网中未暴露在公网的资产,如数据库、私有API等。获取云元数据:例如访问获得云服务器上敏感的配置信息或密钥。侧向攻击:在更深层的漏洞场景下,如果服务器对内部网络拥有较高权限,攻击者还能利用 SSRF 辅助横向渗透其他机器。SSRF是一种利用服务器端向外发送请求的漏洞手段,攻击者可以借此探测或攻击内网。最佳防御策略禁止或严格限制用户可控的URL请求;使用代理(如Squid)集中管理、筛选允许访问的域名/IP;
2025-03-20 19:25:03
793
原创 Dify - 架构、部署、扩展与二次开发指南
本文详细解析 Dify 的架构、部署流程、高可用中间件的独立部署方法,以及二次开发流程,帮助开发者更高效地管理和扩展 Dify。通过本指南,你可以更好的了解 Dify 的部署结构和代码结构,更高效地管理 Dify 的部署、扩展和二次开发,提高 AI 应用的灵活性和可维护性。
2025-03-20 18:47:11
7701
13
原创 向量数据库全景概览:100+解决方案分类解析
随着AI技术的快速发展,向量数据库已成为处理高维数据、支持相似性搜索的核心基础设施。本文将对当前主流的100+向量数据库/存储方案进行分类解析,为技术选型提供全景式参考。
2025-03-15 18:00:00
877
原创 Docker 镜像优化:如何避免重复安装软件,加速服务的构建与部署
构建持久化 Base Image:通过 Dockerfile 预装所有基础依赖,并构建版本化的基础镜像。基于 Base Image 构建服务镜像:各个服务镜像仅包含业务代码部分,构建速度更快。将镜像推送到公共或私有仓库:方便团队共享和 CI/CD 自动化,进一步提升部署效率。通过以上优化方案,你不仅能显著降低 Docker 镜像构建时间,还能确保每次部署都基于一致且经过测试的环境。希望这篇博客能为你的项目部署带来帮助,让开发和运维过程更加高效和可靠!🚀。
2025-03-15 14:00:00
789
原创 如何构建持久化镜像:避免重启后安装软件丢失
方法解决方案描述提交新镜像使用将当前容器状态保存为新镜像,适合临时调试。使用 Dockerfile编写 Dockerfile 构建包含 tightvncserver 的镜像,适合标准化流程。挂载数据卷通过卷挂载保存配置和数据,确保重启容器时配置文件不会丢失。对于正式环境和长期使用,推荐使用 Dockerfile 构建持久化镜像,并结合自动化启动脚本(例如设置CMD命令),实现容器启动时自动运行 VNC 服务。这样不仅保证了软件安装的持久性,还能确保环境的一致性和可维护性。
2025-03-15 12:00:00
743
原创 Manus 技术探索 - 使用 gVisor 在沙箱内运行 Ubuntu 容器并通过远程浏览器访问
本文介绍了如何利用 gVisor 沙箱技术运行带 GUI 的 Ubuntu 容器,并通过 VNC/NoVNC 实现远程浏览器访问。安装并配置 gVisor:下载 runsc,配置 Docker 使用 gVisor 作为运行时,并重启 Docker。运行 Ubuntu 容器并安装 VNC 服务:启动容器,更新软件包,安装 XFCE 桌面环境和 tightvncserver。配置 VNC 服务器:初始化 VNC 服务,设置启动脚本以加载 XFCE 桌面,并启动 VNC 服务器。安装并启动 NoVNC。
2025-03-15 10:00:00
1064
1
原创 LangChain教程 - Agent -之 REACT_DOCSTORE
ReAct(Reasoning + Acting)是一种结合了推理(Reasoning)和行动(Acting)的智能代理架构。它让 AI 能够在推理的同时与环境进行交互,从而提升决策能力。例如,在问答任务中,ReAct 允许 AI 先进行逻辑推理,再调用搜索工具获取更多信息。REACT_DOCSTORE 在 ReAct 基础上集成了文档存储(DocStore),让 AI 先检索相关文档,再进行推理。这种方式适用于信息密集型任务,能够大幅提高 AI 对知识库的支持能力。
2025-03-15 00:50:23
937
原创 LangChain教程 - Agent -之 ZERO_SHOT_REACT_DESCRIPTION
零样本学习(Zero-Shot):无需提供示例,LLM 通过工具的描述来决定如何使用它们。自适应推理(ReAct):LLM 通过思考和行动循环决定调用哪个工具。工具可扩展:可以动态地向 Agent 添加新的工具。这种方式特别适用于开放域问答场景,例如查询天气、获取时间、计算数值等。
2025-03-11 19:00:00
1681
原创 J-LangChain - Agent - 编排一个 ReAct + Function Call 反应链
j-langchain 是一款基于 Java 的 AIGC 编排框架,致力于集成多种大模型(LLM)调用及 RAG 工具。自 1.0.8 版本起,我们引入了工具函数(Function Call)调用能力,正式实现了Tools功能,并将其与模式结合,从而构建出功能丰富、交互智能的Agent系统。在本文中,我们将通过一个详实的实例,展示如何利用 Tools 功能编排一个具备 ReAct 反应链的 Agent。
2025-03-11 12:30:22
1501
原创 LangChain教程 - Agent - 支持 9 种 ReAct 交互
LangChain 总结了 9 种经典的复杂模型交互模式,每种都针对特定任务设计,兼具独特优势与适用场景,内容涵盖: ReAct、Function Call、知识库、搜索等,使用这些模式可以大大简化这些场景开发难度。这些模式可以使用Agent形式来使用,并以AgentType来做区分,详见下面实例。在开发时,选择合适的 AgentType 是成功的关键,本文将逐一剖析这些代理类型,结合特性分析、应用场景和代码示例,助你在实际项目中快速找到最优解。
2025-03-06 09:00:00
1862
原创 Adapter-Tuning:高效适配预训练模型的新任务
相比 Fine-Tuning,Adapter-Tuning 计算资源消耗更低,并且存储占用小,是预训练模型调优的一个理想选择。Adapter-Tuning 通过在 Transformer 层中插入可训练的 “Adapter” 模块,而不改变原始预训练模型的参数。Adapter-Tuning 作为一种高效的模型调优方法,允许我们在预训练模型的基础上,通过引入轻量级 “Adapter” 层来进行任务特定的学习。本文介绍 Adapter-Tuning 技术,并通过一个意图识别任务的代码示例展示其应用。
2025-03-05 14:00:00
2179
原创 P-Tuning:高效利用预训练模型的轻量级调优方法
这些 Prompt Token 是可训练的参数,类似于传统 Fine-Tuning 过程中的权重更新,但它们仅作用于输入层,避免了对整个预训练模型进行参数调整。P-Tuning(Prefix-Tuning 或 Prompt-Tuning)是一种更高效的微调方法,它通过在输入前添加一组可训练的 “Prompt Embeddings” 来调整模型的行为,而无需修改预训练模型的权重。随着预训练语言模型(PLM)在自然语言处理(NLP)任务中的广泛应用,Fine-Tuning 仍然是最常用的微调方法。
2025-03-05 09:00:00
442
原创 Prompt-Tuning:让预训练模型更高效地适配任务
随着预训练语言模型(如 BERT、GPT、T5)的发展,Fine-Tuning 已成为 NLP 任务中的常见方法。Prompt-Tuning 作为一种轻量级替代方案,通过添加任务相关的提示(Prompt)来调整模型的行为,极大减少了参数更新的需求,同时提升任务适配性。Prompt-Tuning 是一种高效的 NLP 任务适配方法,能够在不改变大量模型参数的情况下,引导预训练模型完成特定任务。Prompt-Tuning 的核心思想是利用 “提示模板” 来引导预训练模型的输出,而不直接修改模型权重。
2025-03-04 15:40:00
939
原创 Fine-Tuning:从零开始训练文本润色模型
在自然语言处理(NLP)任务中,文本润色(text polishing)是一项重要的应用,例如帮助用户提升写作质量、改善语法或增强表达清晰度。T5(Text-to-Text Transfer Transformer)模型以其强大的泛化能力和灵活的文本转换特性,成为 Fine-Tuning 任务的理想选择。本文将通过一个简单的示例,介绍如何对 T5 模型进行 Fine-Tuning,使其具备自动文本润色能力。在 T5 中,所有任务都需要一个前缀,例如“polish:”,用于指示任务类型。
2025-03-04 08:00:00
346
原创 MOE(Mixture of Experts)门控网络的实现与优化
门控类型计算量适用场景适用专家数低小规模 MOE,计算简单所有专家低仅使用部分专家,适合大模型选定专家MLP 作为门控中提取复杂特征,提高精度所有专家LSTM 作为门控高时间序列数据(金融/语音)可调Transformer 作为门控高NLP 任务,大规模数据可调如果你的任务数据较简单,建议使用或,如果需要更复杂的决策,可以用MLP、LSTM 或 Transformer作为门控网络。你可以根据任务需求,调整 MOE 的门控策略来提升模型性能!🚀。
2025-03-03 20:21:22
1181
原创 思维链(Chain of Thought, CoT)推理原理解析
思维链(Chain of Thought, CoT)是一种逐步推理的提示方法,引导模型在回答问题时,分步骤推导答案,而不是直接给出最终答案。让模型先生成一系列推理步骤。再基于这些推理步骤得出最终结论。这种方式类似于人类解题时的思维过程,例如在数学计算、逻辑推理、代码分析等任务中,我们通常不会直接写出答案,而是先进行分析、计算、归纳,最后得出结论。
2025-03-03 20:19:23
1237
原创 微调训练方法概述:Fine-tuning、Prompt-tuning、P-tuning 及其他高效技术
在深度学习和自然语言处理的应用中,微调是一个至关重要的步骤。通过选择合适的微调方法,我们可以更高效、更精确地将预训练模型应用到特定任务中。不同的微调技术各有其优势和应用场景,选择适合自己任务的微调策略,将大大提升模型的性能与效率。
2025-02-28 15:09:39
1071
原创 用JAVA玩转LangChain编排:打造会“自我进化”的AI笑话大师
你有没有想过,让AI不仅会讲笑话,还能根据评价“自我进化”,生成更搞笑的版本?今天,我们将用Java和打造一个“AI笑话大师”,它能根据你的主题生成笑话,聪明地评价自己,然后迭代出更幽默的升级版。准备好了吗?让我们用Java玩转AI编排的魔法,一步步解锁这个超酷的应用!
2025-02-28 08:00:00
565
原创 J-LangChain,用Java实现LangChain编排!轻松加载PDF、切分文档、向量化存储,再到智能问答
Java如何玩转大模型编排、RAG、Agent???在自然语言处理(NLP)的浪潮中,LangChain作为一种强大的模型编排框架,已经在Python社区中广受欢迎。然而,对于Java开发者来说,能否有一个同样高效、灵活的工具来实现类似功能?答案是肯定的!今天,我们将聚焦 J-LangChain——一个专为Java打造的LangChain实现,带你探索如何用Java语言轻松构建从PDF处理到智能问答的现代NLP系统。
2025-02-27 08:00:00
1740
原创 J-LangChain - RAG - PDF问答
是一个基于 Java 的链式模型开发框架,旨在帮助开发者利用现代语言模型(如 ChatGPT、Ollama 等)进行多步骤的推理和数据处理。它特别适合用于构建编排复杂的应用程序,这些应用程序涉及到多个步骤的转换、文档处理、模型推理等。本文展示了如何使用 J-LangChain 框架从 PDF 文件中提取信息并进行基于问题的回答。我们通过加载 PDF 文档、切分文档、向量化文档内容并存储到 Milvus 中,然后构建问答流程,最终利用语言模型来回答用户的问题。
2025-02-26 18:22:33
1716
原创 LangChain教程 - RAG - PDF问答
我们使用RAG(检索增强生成)技术,将检索到的文档与生成模型(如ChatOllama)结合,生成最终的答案。方法提供了一个预定义的RAG提示模板。# 定义RAG提示模板# 格式化检索到的文档# 定义RAG链| prompt在这里,我们将检索到的文档内容格式化为字符串,并将其与用户的查询一起传递到生成模型中,以生成最终的答案。通过本教程,我们展示了如何使用FastAPI和LangChain框架,结合检索增强生成(RAG)技术,构建一个基于PDF文档的问答系统。
2025-02-26 17:45:23
1351
原创 使用 Milvus 与 Ollama 进行文本向量存储与检索
Milvus用于存储向量数据和执行快速相似度搜索。Ollama提供文本嵌入 API,将文本转化为高维向量,作为 Milvus 中存储的向量数据。我们将首先在 Milvus 中创建一个集合,并定义存储结构,然后将文本数据和对应的向量插入到该集合中,最后实现向量的相似度查询。通过本示例,我们展示了如何结合Milvus和Ollama完成文本向量的存储和相似度检索。Milvus提供了强大的向量存储和检索功能,而Ollama则通过其 API 提供了高效的文本嵌入服务。
2025-02-26 10:34:30
1491
原创 LangChain教程 - RAG - 支持的100种向量数据库
随着人工智能和机器学习应用的快速发展,尤其是在自然语言处理(NLP)、图像识别、推荐系统等领域,对高效的向量存储和检索需求日益增长。通过对这些100多种向量存储解决方案的介绍,我们可以看到,随着人工智能和机器学习技术的不断进步,向量数据存储的需求也在不断增长。从内存型存储到基于云的分布式存储系统,针对不同应用场景和数据规模的需求,向量存储平台不断发展和优化。无论是小规模的开发环境,还是大规模的企业级应用,还是实时数据处理需求,开发者可以根据具体的场景需求选择最适合的向量存储解决方案。
2025-02-25 18:54:09
1186
Mini-Omni:语言模型可以在流式传输中聆听、交谈和思考
2024-09-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人