- 博客(64)
- 资源 (1)
- 收藏
- 关注
原创 大模型领域三个不同维度的关键技术三种方式(对比学习、MOE、HSTU)
这是一种“在比较中学习”的范式。其核心思想不是让模型预测一个确切的标签,而是学习一个“表示空间”,在这个空间里,相似样本的表示距离近,不相似样本的表示距离远。希望这个详细的展开介绍能帮助您全面理解这三项重要技术。MOE是一种将“专家”组合起来的模型架构,旨在实现。的“系统级”黑科技。
2025-12-26 17:44:39
675
原创 RAG常见向量数据库对比(截至2025年12月)
数据规模:从小型到超大规模的不同需求性能要求:延迟、吞吐量、召回率运维能力:团队技术栈和运维经验成本预算:开源免费 vs 商业托管特殊功能:混合搜索、多模态、实时更新等Pinecone(商业托管)Milvus(开源大规模)Qdrant/Weaviate(功能丰富),根据具体场景灵活选择。
2025-12-26 17:17:01
671
原创 三式掌握知识法
以输出和模拟实践检验输入效果,巩固学习成果。:信息是一切的基础,应广泛获取并严格筛选。的闭环,是一种高效且结构化的学习策略。:通过多轮重复与主动加工,将知识内化。随笔记录一些学习方法,我将它总结为。
2025-12-26 14:14:41
151
原创 GPU占用率40%却无法压榨问题的原因及解决方案
也能将吞吐量提升10倍以上(实测类似场景从0.03→0.5 requests/s)。后续再引入动态批处理可进一步优化。,而非GPU算力不足。通过预加载模型+异步流水线,
2025-12-25 09:20:08
1103
原创 高CPU使用率50%掩盖单核瓶颈,导致GPU等待数据的原因【CPU-GPU流水线阻塞】
CPU使用率50%可能隐藏单核瓶颈(如GIL),导致GPU因数据饥饿而闲置。需通过细粒度监控和并行优化,确保CPU能及时为GPU提供数据。
2025-12-25 08:48:51
347
原创 在Java中加载和调用Embedding模型
DJL是亚马逊开发的Java深度学习库,支持PyTorch、TensorFlow等模型。根据搜索结果,DeepSeek4j提供了BGE-M3的Java支持。如果模型部署在Python服务中,可以通过HTTP调用。这是最直接且性能较好的Java集成方式。加载模型、设置为评估模式并导出onnx。
2025-12-24 09:20:12
465
原创 windows系统运行的bat/cmd脚本和linux运行的sh脚本(入门版)
新建文件txt文件,输入如下内容:说明:保存为 或 双击运行新建文件输入如下内容:说明:保存为 后需要:这两个脚本都只完成最基本的输出功能,是两种系统中最简单的脚本示例。https://blog.csdn.net/lengye7/article/details/107948564
2025-12-24 09:06:46
285
原创 Conda最基础使用命令
这样你就拥有了一个最干净 Conda 环境,可以根据需要安装特定包而不会受到其他包的干扰。这将显示一个非常简短的包列表,通常只包含 Python 和几个必要的依赖项。
2025-12-19 17:18:31
258
原创 Java/Maven 对比 Python/PyPI
维度Java/Maven优势方入门难度中等(需要配置多)简单(一键上传)Python发布速度慢(审核+同步)快(即时发布)Python安全性高(强制签名+审核)中(依赖社区)Java灵活性中(XML配置固定)高(多种工具)Python企业支持强(Nexus/Artifactory)中(私有方案较少)Java社区活跃度稳定非常活跃Python跨平台好(JVM)优秀(原生)Python。
2025-12-19 17:14:00
474
原创 搭建本地支持联网推理助手(附源码)
https’: ‘http://XXXXXXXX’, # 替换为自己的域账号和密码。“我的代码报如上,我的代码报错如下。“请帮我修改python代码,功能要求如下:”,“请帮我写python代码,功能要求如下:”,“下述错误是什么原因?
2025-12-12 11:03:41
679
原创 大模型Agent技术——集成计算器功能,附代码和提示词
大模型Agent是基于大规模语言模型(LLM)构建的智能实体,它融合了自主性、交互性、反应性和主动性等多元特质。与单纯的大模型不同,Agent不仅能够理解和生成文本,还能自主决策和执行任务,实现从"计划"、“组织”、"执行"到"学习"的完整闭环。Agent可被视为"具备自主智能的实体",也被广泛称作智能体。当前的Agent主要分为三种类型:单体Agent、多Agent协作(Multi-Agent)以及与人交互的Agent。
2025-05-07 11:02:00
626
原创 使用双编码器模型(DPR)进行文档密集检索
双编码器模型的核心思想是将查询和文档分别编码为向量,然后通过计算向量之间的相似度(如余弦相似度)来衡量查询与文档的相关性。查询编码器(Query Encoder):将查询文本编码为固定长度的向量。文档编码器(Document Encoder):将文档文本编码为固定长度的向量。通过将查询向量与文档向量进行比较,可以快速找到与查询最相关的文档。这种方法在大规模文档检索中非常高效,因为文档向量可以预先计算并存储。双编码器模型是一种高效的文档检索方法,特别适用于大规模文档库。
2025-05-07 10:27:10
484
原创 GraphRAG:用图结构增强检索与生成
GraphRAG是一种基于图结构的检索增强生成技术。与传统的RAG模型不同,GraphRAG利用图结构来组织信息:图中的节点表示实体或概念,边表示它们之间的关系。这种结构能够更自然地捕捉复杂语义和上下文信息,从而提高检索的准确性和生成内容的相关性。GraphRAG通过引入图结构,为传统的RAG模型带来了更强的语义理解能力。它不仅能够处理更复杂的任务,还能生成更准确、更相关的内容。随着图神经网络技术的不断发展,GraphRAG有望在问答、对话生成等领域发挥更大的作用。
2025-05-07 10:22:29
454
原创 稀疏检索代表算法BM25
BM25 是一种基于词频和文档长度的相关性评分算法。它通过计算查询词与文档的匹配程度,评估文档与查询的相关性。BM25 的核心思想是:词频(TF):查询词在文档中出现的频率越高,相关性越高。逆文档频率(IDF):查询词在整个文档集合中出现的频率越低,其区分能力越强,相关性越高。文档长度:较短的文档更容易与查询匹配,因此需要对文档长度进行归一化处理。
2025-05-07 10:19:44
993
原创 基于gradio搭建自用大模型
常用到大模型辅助工作,但使用在线大模型时会遇到服务繁忙等问题。因此基于gradio搭建了自用的deepseek模型。
2025-03-24 14:39:37
251
原创 解决certificate verify failed: self-signed certificate in certificate chain (_ssl.c:1006)‘)))
调用http接口时,由于启用了ssl证书认证且ssl证书校验失败,因此无法调用该http接口。关闭ssl校验即可。
2025-01-20 17:30:22
1637
原创 调用大模型API接口超时Connection to ark.cn-beijing.volces.com timed out. (connect timeout=3)‘))”
调用豆包大模型api接口报错,提示连接超时。
2025-01-20 17:28:50
1410
原创 解决内网调用大模型接口错误Unverified HTTPS request is being made to host ‘xxx.com‘. Adding certificate
使用python程序发送http请求时,提示错误“Unverified HTTPS request is being made to host ‘proxy.huawei.com’. Adding certificate verification is strongly advised”
2025-01-20 17:27:41
620
原创 Windows系统通过%PATH%未能打印环境变量
如下所示,环境变量CLASSPATH仅在PowerShell控制台能打印,在普通控制台不能打印。原因2:要通过PowerShell打印。
2024-12-05 18:19:29
949
原创 手动调用java Main.class,提示“找不到或无法加载主类 .\Main.java”
java命令运行class文件时,必须要再package定义的包的外边。2、进入到代码中声明package位置的上一层目录。
2024-12-05 18:17:58
465
原创 pdfkit提示filepath:xxx/xxx No wkhtmltopdf executable found: “b‘‘“。If this file exists please check
pdfkit依赖了wkhtmltopdf.exe,而命令行未找到wkhtmltopdf的安装路径。解决方法:查询wkhtmltopdf的安装路径,并手动赋值。
2024-12-05 18:16:09
692
原创 使用大模型总结拓展了1份150+页的笔记的方法,附源码
问题:我的笔记内容如下,如果我要了解下述每一个命令的作用,则要每条笔记逐步搜索,很麻烦。ps:图片模糊是内网传图有kb级别大小限制。3、设计Prompt并调用LLM帮我总结。1、从Word文档中获取文本内容。4、将笔记写入到本地md格式文件。5、用Typora导出为pdf。1、先把笔记放在word文档中。2、使用如下命令调用代码。
2024-11-30 15:28:24
843
原创 解决代码中无法访问huggingface.co的问题,而通过浏览器能正常访问huggingface.co?
代码中无法访问huggingface.co的问题,而通过浏览器能正常访问huggingface.co?
2024-11-09 11:22:05
1902
原创 解决类文件具有错误的版本 61.0, 应为 52.0 请删除该文件或确保该文件位于正确的类路径子目录中。
引入了某个Java依赖包,运行时提示错误。
2024-11-09 11:19:26
1760
原创 解决TypeError: _extract_past_from_model_output() got an unexpected keyword argument ‘standardize_cache
原因:transform版本不兼容。
2024-11-09 11:16:00
772
原创 解决找不到模块ModuleNotFoundError: No module named ‘_cffi_backend‘
解决:要上博客上github找合适的版本。也可以尝试重装,且不要指定具体版本。原因:typing版本不兼容。
2024-11-09 11:14:41
709
原创 解决下载依赖失败Could not find a version that satisfies the requirement (from versions:)
原因1:使用的pip源不存在pymsql或不存在pymsql的x.x.x版本。原因2:指定的版本号不存在x.x.x。解决1:下载时指定其他下载源。解决2:不强制指定版本号。
2024-11-09 11:13:06
8311
3
原创 解决You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0
调用openai的api提示错误如下。
2024-11-09 11:11:38
1458
原创 解决Request timed out: xxx(host=‘xxx.xxx.com‘, port=443) Max retries xxxConnection to xxx.xxx.com time
调用某http接口,提示错误如下。
2024-11-09 11:09:47
495
原创 解决访问openai被拦截,Sorry, you have been blocked
访问openai的官网被拦截,提示,如下所示。(内网只能写字,图片与上述文字一致)
2024-11-09 11:06:03
4421
2
原创 解决numpy依赖失败Could not find a version that satisfies the requirement (from versions:)
【代码】解决numpy依赖失败Could not find a version that satisfies the requirement (from versions:)
2024-11-09 10:44:47
1351
原创 解决{ImportError}Pandas requires version ‘3.1.0‘ or newer of ‘openpyxl‘ (version ‘3.0.9‘ currently ..)
原因:urllib3版本兼容性问题。
2024-11-07 12:10:21
4244
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅