徐先生 @_@|||-CSDN博客

原创大模型领域三个不同维度的关键技术三种方式（对比学习、MOE、HSTU）

这是一种“在比较中学习”的范式。其核心思想不是让模型预测一个确切的标签，而是学习一个“表示空间”，在这个空间里，相似样本的表示距离近，不相似样本的表示距离远。希望这个详细的展开介绍能帮助您全面理解这三项重要技术。MOE是一种将“专家”组合起来的模型架构，旨在实现。的“系统级”黑科技。

2025-12-26 17:44:39 675

原创 RAG常见向量数据库对比（截至2025年12月）

数据规模：从小型到超大规模的不同需求性能要求：延迟、吞吐量、召回率运维能力：团队技术栈和运维经验成本预算：开源免费 vs 商业托管特殊功能：混合搜索、多模态、实时更新等Pinecone（商业托管）Milvus（开源大规模）Qdrant/Weaviate（功能丰富），根据具体场景灵活选择。

2025-12-26 17:17:01 671

原创三式掌握知识法

以输出和模拟实践检验输入效果，巩固学习成果。：信息是一切的基础，应广泛获取并严格筛选。的闭环，是一种高效且结构化的学习策略。：通过多轮重复与主动加工，将知识内化。随笔记录一些学习方法，我将它总结为。

2025-12-26 14:14:41 151

原创 GPU占用率40%却无法压榨问题的原因及解决方案

也能将吞吐量提升10倍以上（实测类似场景从0.03→0.5 requests/s）。后续再引入动态批处理可进一步优化。，而非GPU算力不足。通过预加载模型+异步流水线，

2025-12-25 09:20:08 1103

原创高CPU使用率50%掩盖单核瓶颈，导致GPU等待数据的原因【CPU-GPU流水线阻塞】

CPU使用率50%可能隐藏单核瓶颈（如GIL），导致GPU因数据饥饿而闲置。需通过细粒度监控和并行优化，确保CPU能及时为GPU提供数据。

2025-12-25 08:48:51 347

原创在Java中加载和调用Embedding模型

DJL是亚马逊开发的Java深度学习库，支持PyTorch、TensorFlow等模型。根据搜索结果，DeepSeek4j提供了BGE-M3的Java支持。如果模型部署在Python服务中，可以通过HTTP调用。这是最直接且性能较好的Java集成方式。加载模型、设置为评估模式并导出onnx。

2025-12-24 09:20:12 465

原创 windows系统运行的bat/cmd脚本和linux运行的sh脚本（入门版）

新建文件txt文件，输入如下内容：说明:保存为或双击运行新建文件输入如下内容：说明:保存为后需要:这两个脚本都只完成最基本的输出功能，是两种系统中最简单的脚本示例。https://blog.csdn.net/lengye7/article/details/107948564

2025-12-24 09:06:46 285

原创 windows运行cmd.exe /c xxx.bat文件后输出乱码？�밴��. . .

有问题的乱码结果：xxxxxxxx。

2025-12-24 09:01:52 276

原创 Conda最基础使用命令

这样你就拥有了一个最干净 Conda 环境，可以根据需要安装特定包而不会受到其他包的干扰。这将显示一个非常简短的包列表，通常只包含 Python 和几个必要的依赖项。

2025-12-19 17:18:31 258

原创 Java/Maven 对比 Python/PyPI

维度Java/Maven优势方入门难度中等（需要配置多）简单（一键上传）Python发布速度慢（审核+同步）快（即时发布）Python安全性高（强制签名+审核）中（依赖社区）Java灵活性中（XML配置固定）高（多种工具）Python企业支持强（Nexus/Artifactory）中（私有方案较少）Java社区活跃度稳定非常活跃Python跨平台好（JVM）优秀（原生）Python。

2025-12-19 17:14:00 474

原创（Wheel 格式） Python 的标准分发格式的生成规则规范

whl。

2025-12-19 17:11:34 261

原创搭建本地支持联网推理助手(附源码)

https’: ‘http://XXXXXXXX’, # 替换为自己的域账号和密码。“我的代码报如上，我的代码报错如下。“请帮我修改python代码，功能要求如下：”,“请帮我写python代码，功能要求如下：”,“下述错误是什么原因？

2025-12-12 11:03:41 679

大模型Agent是基于大规模语言模型(LLM)构建的智能实体，它融合了自主性、交互性、反应性和主动性等多元特质。与单纯的大模型不同，Agent不仅能够理解和生成文本，还能自主决策和执行任务，实现从"计划"、“组织”、"执行"到"学习"的完整闭环。Agent可被视为"具备自主智能的实体"，也被广泛称作智能体。当前的Agent主要分为三种类型：单体Agent、多Agent协作(Multi-Agent)以及与人交互的Agent。

2025-05-07 11:02:00 626

原创使用双编码器模型（DPR）进行文档密集检索

双编码器模型的核心思想是将查询和文档分别编码为向量，然后通过计算向量之间的相似度（如余弦相似度）来衡量查询与文档的相关性。查询编码器（Query Encoder）：将查询文本编码为固定长度的向量。文档编码器（Document Encoder）：将文档文本编码为固定长度的向量。通过将查询向量与文档向量进行比较，可以快速找到与查询最相关的文档。这种方法在大规模文档检索中非常高效，因为文档向量可以预先计算并存储。双编码器模型是一种高效的文档检索方法，特别适用于大规模文档库。

2025-05-07 10:27:10 484

原创 GraphRAG：用图结构增强检索与生成

GraphRAG是一种基于图结构的检索增强生成技术。与传统的RAG模型不同，GraphRAG利用图结构来组织信息：图中的节点表示实体或概念，边表示它们之间的关系。这种结构能够更自然地捕捉复杂语义和上下文信息，从而提高检索的准确性和生成内容的相关性。GraphRAG通过引入图结构，为传统的RAG模型带来了更强的语义理解能力。它不仅能够处理更复杂的任务，还能生成更准确、更相关的内容。随着图神经网络技术的不断发展，GraphRAG有望在问答、对话生成等领域发挥更大的作用。

2025-05-07 10:22:29 454

原创稀疏检索代表算法BM25

BM25 是一种基于词频和文档长度的相关性评分算法。它通过计算查询词与文档的匹配程度，评估文档与查询的相关性。BM25 的核心思想是：词频（TF）：查询词在文档中出现的频率越高，相关性越高。逆文档频率（IDF）：查询词在整个文档集合中出现的频率越低，其区分能力越强，相关性越高。文档长度：较短的文档更容易与查询匹配，因此需要对文档长度进行归一化处理。

2025-05-07 10:19:44 993

原创基于gradio搭建自用大模型

常用到大模型辅助工作，但使用在线大模型时会遇到服务繁忙等问题。因此基于gradio搭建了自用的deepseek模型。

2025-03-24 14:39:37 251

原创手把手教你搭建个人桌面AI助手（满血版671B-DeepSeek）

DeepSeek满血版本搭建教程

2025-02-12 00:12:05 885

原创解决certificate verify failed: self-signed certificate in certificate chain (_ssl.c:1006)‘)))

调用http接口时，由于启用了ssl证书认证且ssl证书校验失败，因此无法调用该http接口。关闭ssl校验即可。

2025-01-20 17:30:22 1637

原创调用大模型API接口超时Connection to ark.cn-beijing.volces.com timed out. (connect timeout=3)‘))”

调用豆包大模型api接口报错，提示连接超时。

2025-01-20 17:28:50 1410

原创解决内网调用大模型接口错误Unverified HTTPS request is being made to host ‘xxx.com‘. Adding certificate

使用python程序发送http请求时，提示错误“Unverified HTTPS request is being made to host ‘proxy.huawei.com’. Adding certificate verification is strongly advised”

2025-01-20 17:27:41 620

原创 Windows系统通过%PATH%未能打印环境变量

如下所示，环境变量CLASSPATH仅在PowerShell控制台能打印，在普通控制台不能打印。原因2：要通过PowerShell打印。

2024-12-05 18:19:29 949

原创手动调用java Main.class，提示“找不到或无法加载主类 .\Main.java”

java命令运行class文件时，必须要再package定义的包的外边。2、进入到代码中声明package位置的上一层目录。

2024-12-05 18:17:58 465

原创 docker的常用命令操作

【代码】docker的常用命令操作。

2024-12-05 18:16:48 154

原创 pdfkit提示filepath:xxx/xxx No wkhtmltopdf executable found: “b‘‘“。If this file exists please check

pdfkit依赖了wkhtmltopdf.exe，而命令行未找到wkhtmltopdf的安装路径。解决方法：查询wkhtmltopdf的安装路径，并手动赋值。

2024-12-05 18:16:09 692

原创使用大模型总结拓展了1份150+页的笔记的方法，附源码

问题：我的笔记内容如下，如果我要了解下述每一个命令的作用，则要每条笔记逐步搜索，很麻烦。ps：图片模糊是内网传图有kb级别大小限制。3、设计Prompt并调用LLM帮我总结。1、从Word文档中获取文本内容。4、将笔记写入到本地md格式文件。5、用Typora导出为pdf。1、先把笔记放在word文档中。2、使用如下命令调用代码。

2024-11-30 15:28:24 843