- 博客(5)
- 收藏
- 关注
原创 【无标题】
本文记录了RAG智能问答系统开发第二周的迭代优化过程。在基础架构搭建完成后,借助AI工具Trae规划优化路径,最终聚焦知识库扩充和RAG技术调优两条主线。重点构建了包含30-50个标准问题的测试评估体系,定义关键词召回率、引用准确率等量化指标,为参数调优提供基准。同时优化文本分块策略,实验不同chunk_size和chunk_overlap参数组合。本周沉淀的关键经验包括:评估体系是优化的前提、AI工具辅助但不替代决策、知识库质量决定系统上限。下周将继续完成参数调优实验和知识库扩充工作。
2026-05-06 22:47:46
323
原创 项目实训|RAG技术的理解与初步实现
1. 知识库质量是天花板,算法是地板知识库的质量是RAG技术的地基,不仅要构建语义明确,参考价值客观的数据库文件,还要对资料进行合理的切分。结构混乱、段落过长、术语不统一的文档,会导致向量化后根本无法精准检索。花在知识库整理上的时间,比调优 top_k 参数有价值得多。2. 距离阈值过滤是必要的很多 RAG 教程只说检索 top_k 个结果,但不说如果这 k 个结果都不相关怎么办。在没有距离阈值过滤时,即使问题与知识库完全不相关,系统仍会把最相近的 k 个 Chunk 塞给 LLM,导致答非所问。
2026-04-26 10:29:29
370
原创 项目实训(一)|从选题到项目确定的前期准备
项目是项目上限的一大决定性因素,为保证选题具有合理性、可用性、效益性和社会价值性,在学院正式发布项目实训组队通知前,我们已提前确定团队组织,依托社会热点、社会痛点、技术热潮和近期获奖项目对选题立意展开了数次讨论。针对技术发展趋势和近期全国大学生软件创新大赛获奖名单、山东省大学生创新创业训练计划立项名单,团队首先排除了已发展成熟的食谱识别、类似作业帮的小学教育等主题。因本次项目实训鼓励大模型的使用,我决定将获奖名单上传至AI大模型,由大模型分析选题趋势。
2026-03-25 16:47:24
27
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅