- 博客(101)
- 收藏
- 关注
原创 什么是RAG?一文搞懂检索增强生成技术
本文介绍检索增强生成(RAG)技术的基本原理与应用价值。RAG通过"检索-生成"两阶段机制,将大语言模型与外部知识库结合,解决模型时效性不足、专业领域知识缺失和幻觉问题。系统核心包含数据预处理(文档切分/向量化)、检索模块(稀疏/密集/混合检索)和生成模块(LLM合成答案)。作者将推出系列文章深入解析RAG全流程实现,包括文档解析、切分策略、Embedding技术等,相关资源已开源至Github项目LLMHub。该技术正推动AI助手、专业问答等应用突破静态知识限制,实现更精准的信
2025-06-03 11:24:21
714
原创 一文搞懂RAG 的文档解析
本文介绍了RAG系统的文档解析技术,重点探讨了PDF解析的三大方法:基于规则的方法(如PyPDF)简单但段落完整性差;深度学习方法(如PP-StructureV2)能识别复杂布局但表格识别仍不精准;多模态大模型(如Qwen2.5-VL)通过端到端智能理解实现版面精准还原。这三种方法各有优缺点,需要根据实际需求选择适合的技术方案。文章还提供了相关技术指南和开源项目链接,为构建高质量RAG系统提供参考。
2025-06-03 11:23:01
645
原创 RAG 的文档解析:PDF 篇
本文探讨了PDF解析在RAG技术中的关键作用及其挑战。PDF因其非结构化特性,在文本提取、表格识别、跨页关联等方面存在困难。现有解析方法分为三类:基于规则的PyPDF等方法适合简单文档但精度有限;深度学习方法如PP-StructureV2通过版面分析提升复杂文档处理能力;新兴的多模态大模型(如Qwen2.5-VL)可实现端到端智能解析,但成本较高。随着大模型发展,PDF解析正从传统规则向AI驱动转变,为知识库构建提供更高效方案。
2025-06-01 21:51:08
1176
原创 什么是RAG?一文搞懂检索增强生成技术
RAG(检索增强生成)是一种结合检索与生成技术的大语言模型优化方法。它通过先检索外部知识库,再结合检索结果进行生成,解决大模型面临的数据时效性、专业性和准确性不足的问题。RAG的核心流程包括Query输入、Retriever检索和Generator生成三个步骤,有效降低模型幻觉。
2025-06-01 21:49:27
570
原创 梯度消失和梯度爆炸的原因及解决办法
梯度消失和梯度爆炸是由于深层神经网络中反向传播时梯度连乘效应导致的。梯度消失源于激活函数饱和(如sigmoid)或权重过小,使梯度趋近0;梯度爆炸则由于权重过大导致梯度指数级增长。解决方法包括:使用ReLU等激活函数、合理初始化权重(He/Xavier)、批归一化(BatchNorm)、梯度裁剪(Gradient Clipping)、残差连接(ResNet)及自适应优化器(Adam)。这些技术能有效稳定训练过程,提升模型性能。
2025-05-27 21:33:28
388
原创 大模型背后的协议与接口设计(一)- MCP
本文介绍了大模型背后的协议与接口设计系列专题的第一部分——模型上下文协议(MCP)。MCP是由Anthropic提出的开放协议,用于标准化AI模型与各类数据源的交互方式。文章从三个方面解析MCP:首先阐明MCP如同USB协议般连接AI模型与数据源;其次分析其客户端-服务器架构,包括Host、Client、Server等核心组件;最后描绘其类似HTTP的工作流程,其中AI工具通过MCP透明地访问本地或远程数据。MCP的出现使AI从被动应答者转变为能主动调用数据的智能执行者,大幅提升了工作效率。
2025-05-27 11:38:34
993
原创 解决AttributeError: module ‘backend_interagg‘ has no attribute ‘FigureCanvas‘
这个问题是matplotlib版本太高导致的,只需要将matlptlib版本降低到3.5.0即可。
2024-11-08 16:05:58
380
原创 将一个(768,1)的张量转换为(1024,)
我想要将一个(768,1)的张量转换为(1024,)试了下面几个方法都没有得到目标结果。最后通过零填充实现的。
2024-04-26 09:51:18
211
原创 springboot no mapping for.....解决办法
这个问题是由于没有加入对应的GET,POST注解,导致映射失败,加入对应注解就ok了。
2024-04-21 19:40:24
2592
原创 Consider defining a bean of type ‘com.sky.service.DishService‘ in your configuration.怎么解决
这个问题通常是因为Spring Boot无法找到你指定的bean。在你的代码中,你已经定义了一个名为。的类,但是Spring可能在寻找一个名为。这样,Spring Boot就能找到。包下创建一个新的Java接口文件。
2024-04-21 11:03:11
967
原创 tmux命令
tmux是一种后台窗口工具,我们平时远程连接服务器的时候如果自己的电脑关闭,那么连接也会断开,正在运行的程序也就会终止,tmux就可以让我们的程序在后台运行,即使我们的本地机器关机也不会影响服务器中正在运行的程序。下面给出一些tmux的常用命令。
2024-04-17 14:27:26
953
原创 RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one.
在DistributedDataParallel中加入find_unused_parameters=True,如model = torch.nn.parallel.DistributedDataParallel(model, device_ids=[args.local_rank], output_device=args.local_rank, find_unused_parameters=True)这是因为部分参数没有参与计算loss。
2024-04-17 12:13:40
892
原创 ERROR: Could not build wheels for matplotlib, which is required to install pyproject.toml-based
将pip install 换成conda install即可。
2024-04-11 16:34:01
1538
1
原创 报错 ERROR: Unknown host ‘android-mirror.bugly.qq.com‘. You may need to adjust the proxy settings
报错 ERROR: Unknown host 'android-mirror.bugly.qq.com'. You may need to adjust the proxy settings
2024-04-11 10:41:04
605
原创 AttributeError: module ‘backend_interagg‘ has no attribute ‘FigureCanvas‘原因及解决办法
AttributeError: module 'backend_interagg' has no attribute 'FigureCanvas'原因及解决办法
2023-12-20 20:41:32
1244
1
原创 什么是预训练
预训练是出于特殊数据集和低成本数据集数量差距悬殊而提出的一种模型训练方法,即先通过大量的数据集训练得到一组权重可以较好的识别这些数据的共性,从而进行分类、检测等操作,当我们需要处理自己特殊需求的任务时,我们就可以借助之前训练好的模型来针对我们的数据进行参数的调整,从而大大减少了数据集的需求和工作量。
2023-12-19 21:58:36
580
原创 TypeError: expected str, bytes or os.PathLike object, not list原因及解决办法
这个错误通常发生在尝试使用 os 或 zipfile 等库的函数时,传递了不正确的参数类型。因为传递了一个列表对象,但库函数期望接收字符串、字节或类似路径的对象作为参数。os.path.relpath(file_path, folder_path)其中的file_path应该为字符串,但是我搞成了列表,故报错。
2023-12-18 21:55:07
3595
原创 “SELECT * FROM image where %s = ‘1‘ “, (selectedColumn,)这个SQL语句哪里错了
在 SQL 查询语句中,如果要动态地指定列名,需要将列名直接添加到 SQL 查询语句中,而不是作为参数传递。这是因为 SQL 参数化查询中的参数通常用于传递数值或字符串等常量值,而不是用于指定列名或表名。这将把 selectedColumn 变量的值直接嵌入到 SQL 查询语句中,但请确保 selectedColumn 的值是一个有效的列名,以避免 SQL 注入攻击。
2023-12-17 15:09:27
149
原创 (1064, “You have an error in your SQL syntax; check the manual that corresponds to your MySQL server
(1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '== '1'' at line 1")原因及解决办法
2023-12-16 13:21:34
13736
原创 ValueError: invalid literal for int() with base 10: ‘2464,2465,2466,2467,2468‘原因及解决办法
ValueError: invalid literal for int() with base 10: '2464,2465,2466,2467,2468'原因及解决办法
2023-12-16 13:19:37
597
原创 TypeError: %d format: a number is required, not str原因及解决办法
TypeError: %d format: a number is required, not str原因及解决办法
2023-12-14 21:19:49
1594
原创 TypeError: Cannot read properties of undefined (reading ‘row‘)原因及解决办法
TypeError: Cannot read properties of undefined (reading 'row')原因及解决办法
2023-12-14 21:18:36
5697
1
原创 OSError: [WinError 123] 文件名、目录名或卷标语法不正确。: ‘http://localhost:5000/static/images/DICOMDIR 5.26-6.1/364
http://localhost:5000/static/images/DICOMDIR 5.26-6.1/3644351_GOUT_1_0_12.png是存储在数据库中提供给前端用于获取后端图片文件的URL,但是计算机在本地找不到这个地址,需要将http://localhost:5000/去掉
2023-12-12 21:03:40
460
原创 怎么让div中两个元素位于两端
怎么让div中两个元素位于两端将div设置为flex布局,并且将justify-content属性设置为space-between;
2023-12-12 21:01:53
793
原创 GET : 405 (METHOD NOT ALLOWED)错误语言及解决办法
GET http://localhost:5000/dicom_upload 405 (METHOD NOT ALLOWED)
2023-12-11 19:47:39
1631
原创 AssertionError: View function mapping is overwriting an existing endpoint function: get_image_data
AssertionError: View function mapping is overwriting an existing endpoint function: get_image_data
2023-12-10 16:54:19
1055
原创 TypeError: ‘list‘ object is not callable
TypeError: 'list' object is not callable
2023-12-10 16:52:43
884
原创 PermissionError: [Errno 13] Permission denied,后端处理文件时报错
PermissionError: [Errno 13] Permission denied,后端处理文件时报错
2023-12-09 22:10:26
407
原创 flask跨域访问问题has been blocked by CORS policy: No ‘Access-Control-Allow-Origin‘ header is present
flask跨域访问问题Access to XMLHttpRequest at 'http://localhost:5000/get_image_data' from origin 'http://localhost:8080' has been blocked by CORS policy: No 'Access-Control-Allow-Origin' header is present on the requested resource
2023-12-09 22:09:06
479
原创 华为SDC开发报错./hal_nn: error while loading shared libraries: libdsp.so: cannot open shared object file
华为SDC开发报错./hal_nn: error while loading shared libraries: libdsp.so: cannot open shared object file
2023-12-08 10:44:21
99
本文档系统梳理了深度学习面试中常见的核心知识点,涵盖梯度消失与爆炸、BatchNorm/LayerNorm 区别、Dropout 原理、残差结构等问题的原理分析与结构化答题策略
2025-05-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人