自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

舒一笑的博客

纸上得来终觉浅,绝知此事要躬行。

  • 博客(617)
  • 收藏
  • 关注

原创 我的开源项目-PandaCoder迎来史诗级大更新啦

PandaCoder是一款专为中文开发者设计的IntelliJ IDEA插件,集成了中文编程转换、Jenkins Pipeline支持和SpringBoot配置可视化三大核心功能。该插件提供智能多级翻译引擎(国内大模型>Google翻译>百度翻译),支持中文转多种命名格式,并具备Jenkins Pipeline语法高亮、代码补全等专业开发支持。同时能够自动识别SpringBoot配置文件中的技术栈并显示对应图标,大幅提升中文开发者的编程效率和体验。插件支持自定义配置,适用于个人开发者和团队协作场

2025-07-27 17:56:29 1295

原创 撕碎语法教科书!PandaCoder教大模型「暴力越狱」逐字翻译

《熊猫编码助手PandaCoder:中文开发者的AI翻译革命》介绍了一款专为中文开发者设计的智能编码插件。该插件融合通义千问、文心一言等国产大模型,通过创新的提示词配置和模板系统,实现中文思维到专业英文代码的精准转换。相比传统翻译工具,它能将"老马识途"等成语准确转化为符合编程语境的英文表达(如"An experienced hand is a good guide")。插件支持百度翻译API作为备用方案,并提供革命性的中文开发体验。用户可通过IDEA应用商店下载,加

2025-07-21 16:25:36 316

原创 两个list如何根据一个list中的属性去过滤掉另一个list中不包含这部分的属性,用流实现

你可以使用Java 8的流来实现这个功能。假设你有两个包含对象的List,每个对象有一个属性,你想根据一个List中的属性值来过滤掉另一个List中不包含这个属性值的对象。下面是一种使用流的方式来实现这个功能在上面的例子中,我们有两个List:list1包含了MyClass对象,每个对象有一个属性property;list2包含了一些属性值。我们使用流来筛选list1中的对象,只保留那些property值在list2中存在的对象,最后将筛选后的结果收集到filteredList中。AB。

2023-08-16 01:08:57 15170

原创 Java中获取年份月份的方法

【代码】Java中获取年份月份的方法。

2023-07-30 16:31:18 19046

原创 2026 智能体编程趋势报告

摘要 《2026年智能体编程趋势报告》预测AI智能体将重塑软件开发流程。报告指出三大趋势:1)基础趋势:软件开发生命周期剧变,工程师角色转向架构设计和智能体协调;2)能力趋势:单个智能体发展为协同团队,能长期运行构建完整系统,并实现规模化人类监督;3)影响趋势:生产力提升将改变软件开发经济,非技术用例扩展,但需重视安全架构。报告强调AI与人类协作是关键,工程师需从编码转向战略监督,而智能体编程将扩展至非技术领域。早期采用者将获得显著优势,软件开发将演变为人类定义问题、AI负责实现的新模式。

2026-01-23 11:32:53 558

原创 在低配云服务器上实现自动化部署:Drone CI + Gitee Webhook 的轻量级实践

摘要:针对低配云服务器(2核4G/4核4G)的自动化部署难题,本文推荐轻量级解决方案Drone CI + Gitee Webhook。相比传统CI/CD工具,该方案资源占用仅300-600MB,配置简单,支持Gitee代码推送自动触发构建部署。作者提供开箱即用的部署模板,包含Docker配置、构建示例和通知方案,实测可稳定运行在4G内存服务器上,实现从代码提交到上线的全自动流程。该方案特别适合个人开发者或小团队,在有限资源下实现高效自动化部署。

2025-12-14 13:07:35 716

原创 在工具泛滥的时代,我为什么还要做一个“不一样“的工具站

我知道这篇文章有点长,有点"不像推广文"。在这个工具泛滥的时代,我们是否还能做一些"不一样"的东西?在这个追逐流量的时代,我们是否还能坚持一些"慢"的价值?在这个人人都想成为"API"的时代,我们是否还能保持自己的身份?StrLoom 是我的答案。如果你也认同这些想法,欢迎来试试:👉如果你有任何建议、反馈、或者只是想聊聊天,欢迎联系我。让我们一起,用心编码,一次一个字符串。

2025-12-13 15:07:18 562

原创 GitPulse:让代码的故事自己讲述

摘要: GitPulse是一款旨在帮助开发者可视化Git提交记录的工具,将碎片化的代码提交转化为有价值的成长叙事。通过结构化分类(功能开发/Bug修复/架构重构)、可视化图表和语义化分析,它能清晰呈现开发者的工作节奏、技术贡献和成长轨迹。特别功能包括AI代码检测识别、自动生成结构化周报,并支持MongoDB长期归档,帮助开发者积累数字职业资产。该工具完全免费,目标是为个人提供成长档案、为团队建立透明协作、为管理者提供共情视角,最终让开发者的隐性价值被看见。安装后通过IDE侧边栏即可查看智能统计报告。

2025-11-27 22:20:38 886

原创 信息的建筑学:MyBatis Log Panda 如何重构开发者的认知地图

摘要: 《MyBatis Log Panda》是PandaCoder工具宇宙的首个产品,旨在解决开发者面临的日志处理困境——信息过载、上下文断裂和认知负担。该工具通过结构化展示SQL日志(自动参数替换、慢查询高亮、API关联等),将混乱信息转化为清晰认知。其核心哲学是"工具应理解开发者",通过零配置设计降低心智负担,让开发者专注创造性思考而非机械调试。作为系列起点,它预示着未来更多以"技术服务于人"为理念的效率工具,帮助开发者从信息迷宫中解放,重塑优雅的工作方式。 (

2025-11-25 18:23:41 775 2

原创 PandaCoder 的解构与新生:为中文开发者造一束专注的光

更令人深思的是,在开源世界的开放与共享之外,我也遭遇了意料之外的寒流——一些恶意评论、无端指责,甚至对动机的揣测。”这句话曾被简化为一句创业口号,但我越来越体会到它的深意——它是一种承诺:将你独特的洞察、反复打磨的技艺,与对用户深沉的责任感,封装成一个可持续、可复制、能持续创造价值的产品。因为我知道,真正改变编程体验的,往往不是宏大的框架,而是那些在关键时刻“刚刚好”的微小工具。写下这两句话时,“深圳的雨”刚刚停歇,窗外的空气湿润而清冽,像极了我此刻的心情——平静中带着决断。我知道,这或许会让一些人遗憾。

2025-11-23 13:48:03 68

原创 PandaCoder:我的个人开发者工具进化之路

摘要:本文讲述了PandaCoder开发者工具从个人项目到用户驱动进化的历程。作者强调用户反馈而非功能堆砌是产品成功的关键,将"建议功能"置于"打赏"之前体现了这一理念。工具功能如中文编程助手、Jenkins支持和SpringBoot可视化都源自用户需求。通过Git统计、实时监控等数据驱动迭代,以及多翻译引擎选择等社区决策,PandaCoder实现了技术与用户体验的平衡。文章展示了用户如何从使用者转变为共建者,并展望了未来智能化发展方向,最终印证了"最好的产

2025-11-16 12:38:40 1034 1

原创 从手写周报到智能生成:PandaCoder如何让你的工作汇报效率提升10倍

摘要: 周报困境与智能解决方案 开发者每周平均花费1.5-2小时编写周报,属于泰勒科学管理理论中的"低价值重复劳动"。传统周报存在信息碎片化、结构混乱等问题,而PandaCoder插件通过AI技术解决这一痛点: 高效生成:自动提取Git日志,AI智能分类,10分钟完成周报; 专业输出:支持多场景模板(汇报版/技术版),突出成果与价值; 量化收益:个人年省78小时,团队成本降低超12万元。 该工具融合工程化设计与企业级安全,适用于个人、团队及管理者,实现从"搬生铁"到&

2025-11-06 18:04:30 1098 2

原创 用数据照亮成长之路:PandaCoder Git 统计工具窗口

PandaCoder Git统计工具是一款集成在IntelliJ IDEA中的个人成长分析工具,旨在帮助程序员通过Git提交数据实现自我提升。该工具提供七大核心功能:个人统计多维度分析代码贡献、每日统计追踪开发节奏、项目代码统计评估项目规模、总览页面展示成长全貌,以及独特的AI代码统计功能(可识别AI辅助代码占比)。所有功能零配置即可使用,通过可视化数据帮助开发者反思编程习惯、优化代码质量,并平衡AI工具使用,最终实现持续的技术精进。

2025-11-02 20:12:07 1117 1

原创 PandaCoder 2.4.3 震撼发布!

PandaCoder 2.4.3 重磅推出"SQL Monitor"功能,专为Java+MyBatis开发者打造。这款工具能实时监控SQL执行情况,自动解析日志结构,100%还原可执行SQL。其特色包括:零侵入设计、自动关联API调用链、智能识别慢查询和N+1问题。支持SQL类型分类、数据持久化、一键导出等功能,显著提升开发效率和问题排查能力。该版本已上线JetBrains插件市场,帮助开发者清晰掌握每条SQL的执行细节。

2025-10-31 14:44:00 460

原创 PandaCoder:致敬MyBatis Log Plugin,但我们做得更极致!

PandaCoder是一款超越MyBatis Log Plugin的SQL监控工具,提供三大核心功能:自动关联API路径、可视化统计面板和超大JSON支持。它能快速定位慢SQL来源,检测N+1查询,完美解析3000+字符的大JSON参数。相比MyBatis Log Plugin,PandaCoder还具备API追踪、免费使用等优势。该工具已帮助开发者将SQL调试时间从30分钟缩短至1分钟,支持IDEA插件市场一键安装。作为开源项目,PandaCoder持续优化,未来将推出SQL性能趋势图等更多功能。

2025-10-24 02:05:33 656 2

原创 大模型时代的程序员成长悖论:如何在AI辅助下不失去竞争力

人工智能时代程序员的破局之道:工具放大能力而非替代思维 摘要(149字): 在AI工具普及的当下,程序员面临"效率提升但判断力退化"的困境。Naval Ravikant指出工具只会放大使用者的既有能力,强调判断力是运用AI杠杆的支点。Alan Turing则区分机器擅长执行明确定义任务,人类专长模糊问题定义。本文提出破局三法:1)建立第一性原理思维,先问为什么再问怎么做;2)实施反向验证,检验AI方案的适用性;3)构建知识复利系统。关键在于将AI作为思维验证工具而非答案外包源,通过三层思

2025-10-22 23:14:23 634

原创 PandaCoder 2.0.0 - ES DSL Monitor & SQL Monitor 震撼发布!

**PandaCoder 2.0重磅发布!全新推出ES DSL Monitor和SQL Monitor两大数据库监控工具🎉 🔍 ES DSL Monitor 实时捕获Elasticsearch查询,可视化展示完整DSL 自动关联API路径,支持多格式日志解析 零性能损耗,历史查询可回溯 🗃️ SQL Monitor 完整记录MyBatis SQL查询,自动生成可执行SQL 智能分类统计,颜色标识不同操作类型 追踪API调用链路,快速定位N+1查询 ✨ 核心价值: 调试效率提升300% 一键复制查询语句

2025-10-19 20:59:24 360

原创 TorchV知识库安全解决方案:基于智能环境感知的动态权限控制

TorchV知识库安全解决方案提出基于环境感知的动态权限控制新范式,突破传统RBAC模型的局限。该方案通过四层防护体系(环境感知层、策略决策层、数据标签层、审计分析层)实现智能访问控制,采用无侵入式AOP集成和灵活的策略引擎,支持IP、地理位置等多维度校验。其核心优势包括动态上下文感知、精细化权限控制、可视化配置和企业级可靠性,适用于研发资料保护、财务数据安全等场景,为企业数据资产提供智能化的自适应防护。

2025-09-26 14:03:40 816 1

原创 PandaCoder 1.1.8 发布:中文开发者的智能编码助手全面升级

PandaCoder 1.1.8发布,带来多项功能升级:1)新增Bug记录本地存储配置功能;2)中文编程助手优化命名转换能力;3)多引擎翻译系统支持国内外主流API;4)强化SpringBoot配置文件和Jenkins Pipeline支持。该插件专为中文开发者设计,通过智能命名转换、错误管理等核心功能提升开发效率。版本采用模块化架构,支持个性化配置,并提供现代化UI界面。适用于Java开发、CI/CD配置等场景,未来将扩展AI代码生成等高级功能。

2025-09-25 14:21:06 893

原创 Mac环境安装Nginx指南实录

本文详细介绍了在Mac电脑上使用Homebrew安装和配置Nginx的完整流程。主要内容包括:通过Homebrew安装Nginx、启动服务、常用操作命令、配置静态资源路径(替换为宿主机绝对路径)、添加自定义请求头等关键步骤。重点讲解了如何将前端资源部署到Nginx根目录,并提供了多路径代理配置示例,包括设置X-Custom-Header等自定义请求头。文章还包含配置验证、服务重启等实用操作说明,以及卸载方法和开机自启设置,为Mac用户提供了一套完整的Nginx管理方案。

2025-09-20 17:27:24 747 1

原创 TorchV企业级AI知识引擎的三大功能支柱:从构建到运营的技术解析

摘要: 企业级AI知识引擎需解决知识构建、应用与运营三大核心挑战。知识构建通过战略规划与智能加工管道,将多源异构数据转化为结构化知识资产;知识应用采用白盒化机制实现透明检索与权限控制,确保结果可信;知识运营借助闭环监控与自动化工具,保障知识库持续健康。三大支柱形成技术闭环,为AI Agent提供可靠基础,推动企业从效率提升转向业务转型。全文聚焦技术实现,剔除营销内容,配图增强关键流程说明。

2025-09-17 10:34:38 918 1

原创 Saga分布式事务框架执行逻辑

Saga分布式事务框架执行摘要 本框架采用数据库驱动的Saga模式,实现跨服务数据同步一致性。核心特点包括: 分层架构:业务触发层→任务分解层→消费端接收层→定时执行层 关键设计: 混合编排模式(集中分解+分布式执行) 基于execution_key和business_key的强幂等保障 双重重试机制(执行重试+通知重试) 执行状态与通知状态分离管理 表结构亮点:distribute_event_step_log表通过复合索引和状态字段,实现高效查询与精确控制。 容错机制:集成指数退避算法,支持自动重试和补

2025-09-16 14:45:24 991 2

原创 为什么where=Version就是乐观锁了?

这段代码是乐观锁的实现,其核心原理是通过版本号机制控制并发更新。读取数据时不加锁,但在更新时会检查记录的版本号是否与读取时一致。若版本号匹配则更新成功(同时递增版本号),否则更新失败(说明数据已被其他事务修改)。相较于悲观锁,乐观锁性能更高,适用于冲突较少的场景。代码中的version字段是关键,通过WHERE id=... AND version=...条件确保数据一致性,并通过判断更新结果来识别并发冲突。

2025-09-12 09:27:53 467

原创 同步框架与底层消费机制解决方案梳理

本文提出了一种多集群环境下的数据同步解决方案,基于服务注册表和消息表实现分布式协调。方案包含三个核心组件:1)分布式节点注册表(distribute_node_registry),通过心跳机制维护服务实例状态;2)消息表(distribute_event/event_step),采用状态机和乐观锁管理消息生命周期;3)调度器与消费者协同工作,实现负载均衡的消息处理。文章详细介绍了服务注册表的设计(含心跳上报、状态检查机制)和消息表结构(包含唯一索引、状态字段等关键设计),为分布式系统数据同步提供了完整的实现

2025-09-10 22:19:42 412

原创 利用Mybatis自定义排序规则实现复杂排序

本文介绍了文件目录排序功能的实现方案。系统支持三种排序方式:1)文件名A-Z(英文→中文→数字);2)文件名Z-A(反向排序);3)最近更新时间(文件夹和文档分别按修改时间排序)。技术实现上,后端接口新增sortType参数,通过动态构建SQL语句实现复合排序逻辑,包括置顶节点、文件夹优先、多语言字符分类排序等处理。排序算法采用Comparator组合模式,支持null值处理,确保在各种场景下都能正确排序。

2025-09-01 16:11:18 408 2

翻译 Building effective agents 建立有效的agents

摘要 本文探讨了如何构建有效的AI代理系统,比较了工作流(预定义代码路径)与代理(动态决策系统)的区别。文章建议从简单方案开始,仅在处理复杂任务时才采用代理系统,并介绍了多种实现框架(如LangGraph、Bedrock等)及其优缺点。核心部分详细分析了五种常见模式:提示链、路由、并行化、协调器-工作者和评估器-优化器工作流,以及自主代理的适用场景。文章强调工具设计的重要性,并建议在沙盒环境中测试代理系统,同时提供具体应用案例(如编码代理和计算机使用实现)来说明代理系统的实际价值。

2025-08-23 13:50:07 108

原创 如何优雅统计知识库文件个数与子集下不同文件夹文件个数

本文讨论了两种知识库文件统计方案:1)简单场景下通过空间ID筛选直接统计文件数;2)复杂场景下基于全路径编码递归统计文件夹层级文件数。重点分析了第二种方案的技术实现,通过MySQL的INSTR函数配合逗号分隔符,避免了模糊查询的误匹配问题,精确统计指定文件夹及其子目录下的文件数量。该方案利用full_parent_code字段存储层级路径,实现了高效准确的递归计数,同时解决了性能和多级目录统计的难题。

2025-08-22 11:55:58 761

原创 MySQL中模糊匹配like的一个坑

摘要:分析两个相似SQL查询结果差异的原因,发现是由于LIKE匹配规则不同导致。第一条SQL将多个组织ID拼接后整体匹配,第二条SQL则分别独立匹配。深入排查发现部门路径数据存在格式问题,最终通过代码预处理字符串分割解决该问题。建议在数据库操作前进行字符串规范化处理,避免类似匹配异常。(149字)

2025-08-21 14:11:02 339

原创 Mac 上安装并使用 frpc(FRP 内网穿透客户端)指南

本文介绍了在macOS上使用Homebrew安装和配置frpc(内网穿透工具)的详细步骤。主要内容包括:1)安装Homebrew包管理器;2)通过Homebrew安装frpc;3)创建并自定义frpc.ini配置文件;4)启动frpc服务;5)设置后台常驻的两种方法(brew services或LaunchAgent);6)常见问题排查。该教程帮助用户快速将本地服务(如SSH)安全地暴露到公网,支持M1/M2和Intel芯片,并提供了配置示例和优化建议。

2025-08-20 16:50:23 531

原创 Started TttttApplication in 0.257 seconds (没有 Web 依赖导致 JVM 正常退出)

【摘要】Spring Boot应用启动后立即退出的问题分析:日志显示应用成功启动但无Web容器运行痕迹,主线程结束后JVM退出(exit code 0)。根本原因是项目缺少spring-boot-starter-web依赖,导致未启动内嵌服务器。解决方案:1)添加Web依赖构建HTTP服务;2)非Web应用可通过CommandLineRunner维持运行或显式阻塞主线程。该现象属于预期行为而非异常,选择对应方案后问题解决(附成功运行截图)。

2025-08-17 13:02:36 1178

转载 企业AI落地不顺问题可能出在你没搞懂知识库

企业AI落地不顺的关键在于未能有效构建知识库。文章指出,知识不同于数据或文档,而是可验证、显性的经验模型。通过DIKW金字塔和SECI模型,作者阐述了如何将企业数据、信息转化为知识,并强调知识构建、应用和运营是AI知识库的三大核心。TorchV通过流程编排实现知识加工,帮助企业实现知识传承和业务智能化。真正的企业级知识库需要系统化建设,而非简单的文档检索。

2025-08-05 09:44:39 95

转载 Elasticsearch 不愿免费的秘密武器—RRF(TorchV 版)

Elasticsearch隐藏武器RRF:解决多路召回融合难题 在AI搜索技术发展中,多路召回结果融合成为关键挑战。不同检索算法(如向量检索和关键词检索)的分数体系差异大,传统加权方法难以平衡。倒数排名融合(RRF)通过将分数转换为排名倒数求和,巧妙规避了分数尺度问题,实现公平融合。测试显示,RRF可提升召回率约10%。虽然Elasticsearch企业版已内置RRF功能,开源版需自行实现。该技术还可用于问题分解等场景,是混合检索的有效解决方案。专业平台如TorchV已集成RRF,为企业提供开箱即用的智能检

2025-07-16 10:16:17 427

原创 PandaCoder重大产品更新-引入Jenkinsfile文件支持

「熊猫编码助手」插件新增了Jenkinsfile文件支持功能,可作为Jenkinsfile Pro的免费替代方案。该插件主打中文开发者友好,支持中文思考输出英文代码,1.1.3版本已提交审核。安装后提供语法高亮、智能缩进等特性,用户可通过IDEA插件市场直接下载。项目开源地址为https://github.com/shuyixiao-better/PandaCoder,遇到问题可在项目中反馈。插件名称寓意将中国特色与国际标准相结合,助力开发者提升效率。 (字数:149)

2025-07-11 19:44:09 379

原创 n8n汉化部署一篇搞定

本文介绍了如何制作n8n工作流平台的汉化Docker镜像。通过Dockerfile从官方n8n镜像出发,下载中文语言包并替换UI文件,设置中文环境变量。详细说明了打包、标签重命名和推送到私有仓库的步骤,最终实现界面汉化效果。关键点包括版本匹配、权限修改和环境变量配置。文末提供了汉化效果展示和相关参考资料链接,为需要本地化部署n8n的用户提供了完整解决方案。

2025-07-03 11:55:25 1966

原创 基础RAG实现,最佳入门选择(十二)

本文介绍了一个自适应检索增强生成(RAG)系统,该系统通过动态选择最优检索策略来提升回答质量。系统首先对查询进行分类(事实型、分析型等),然后选择相应的检索技术生成定制化回复。技术实现包括:PDF文本提取、文本分块处理、阿里云向量生成和简单向量数据库管理。系统使用通义千问大模型和text-embedding-v2嵌入模型,可自动处理各种查询类型,并通过模块化设计实现高效检索和响应生成。文中还展示了核心代码模块,包括配置类、PDF提取、文本分块、向量生成和向量存储功能。

2025-06-27 15:41:57 1025

原创 工作流引擎技术方案<第一版>

摘要 n8n工作流引擎技术方案主要采用Vue.js技术栈实现可视化编排功能,包括Vue Flow(流程图核心)、Dagre(布局引擎)和Vuedraggable(拖拽功能)。后端采用模块化架构,通过YAML文件定义工作流Schema。工作流数据以JSON格式存储,节点间通过name属性建立关联关系。系统提供了完整的节点参数验证和执行顺序规则实现,支持复杂的工作流编排和管理。技术栈组合合理,既保证了前端交互体验,又能满足后端工作流执行的需求。

2025-06-27 10:31:18 1132

原创 工作流引擎技术方案<初版>

AI工作流引擎技术调研摘要: 目前主流AI工作流引擎方案中,n8n采用Vue Flow+Dagre+Vuedraggable的前端技术栈,后端基于TypeORM和事件驱动架构;Dify采用React+AntV等前端技术。核心需求包括流程可视化、定义存储、引擎执行、任务集成和监控管理。 技术选型建议:1)前端推荐BPMN.js(Camunda生态)或AntV X6等方案;2)后端推荐嵌入式BPMN引擎(Camunda/Flowable),与Spring Boot深度集成;3)数据库支持主流关系型数据库。对于复

2025-06-25 20:37:36 1237

原创 基础RAG实现,最佳入门选择(十一)

本文介绍了一个带有反馈循环机制的动态RAG系统实现方案。该系统通过用户反馈持续优化检索结果,包含PDF文本提取、分块处理、向量生成、向量库构建等核心模块。具体实现包括:使用Python提取PDF文本并分块处理,调用阿里云API生成文本向量,构建支持元数据管理的简单向量库,以及收集存储用户反馈的机制。与传统静态RAG系统相比,该方案能记忆有效交互、调整文档相关性评分,逐步提升响应质量。代码展示了从PDF处理到反馈收集的完整流程,为构建自适应知识问答系统提供了可行方案。

2025-06-25 18:04:05 632

原创 基础RAG实现,最佳入门选择(十)

本文介绍了RAG系统中提高效率的上下文压缩技术,通过过滤和压缩检索文本块来保留最相关信息。主要内容包括:1) 上下文压缩的作用是删除无关内容,聚焦查询相关信息;2) 实现流程涵盖PDF文本提取、分块处理、向量生成和存储;3) 关键代码提供了从PDF提取文本、分块处理、生成向量及构建向量库的具体实现;4) 压缩函数利用LLM根据查询保留相关内容,提供选择性提取、摘要和抽取三种压缩方式。该系统能有效减少噪音,提升响应质量。

2025-06-25 17:33:31 1040

原创 基础RAG实现,最佳入门选择(九)

RSE技术提升RAG系统性能 相关段提取(RSE)技术通过识别文档中连续的文本段,为语言模型提供更连贯的上下文。该方法基于"相关块聚集"假设,通过计算文本块与查询的相关性分数(减去惩罚值irrelevant_chunk_penalty),筛选出真正相关的连续片段。惩罚值调节片段选择精度,值越大结果越精确但可能遗漏边缘内容。 实现流程包括: 从PDF提取原始文本 固定大小分块(无重叠) 使用阿里云模型生成文本向量 构建向量库并执行相似度搜索 计算相关性分数时应用惩罚值,有效过滤无关内容 该

2025-06-25 16:59:49 458

导出Excel技术分享

感谢大家能够参加今天的技术分享会。我很荣幸能够在这里与大家分享关于导出Excel技术的内容。 今天,我将与大家讨论如何利用导出Excel技术来提高工作效率和数据处理的准确性。在现代商业环境中,Excel已经成为我们日常工作中不可或缺的一部分。然而,Excel仅仅是一个存储和计算数据的工具,而导出Excel技术将帮助我们把Excel的功能发挥到极致。 首先,我将介绍导出Excel技术的概念和背景。导出Excel是指将其他数据源(如数据库、网页、文本文件等)中的数据以Excel的格式进行输出。这种技术可以帮助我们快速、准确地将大量数据导入到Excel中进行进一步处理和分析。 接下来,我将分享导出Excel技术的优势和应用场景。通过导出Excel技术,我们可以轻松地从各种数据源中提取数据,并将其导入到Excel中进行处理。这将极大地简化大数据量处理的过程,提高工作效率。此外,导出Excel技术还可以帮助我们生成具有格式化样式和公式的Excel报表,使数据的展示更加直观、易读。 然后,我将深入探讨导出Excel技术的实现方法和工具。在这一部分,我将介绍一些常用的导出Excel技术,如使

2023-09-15

MySQL数据类型选择

MySQL数据类型选择

2023-08-14

SynchronousQueue核心属性和方法源码的分析

SynchronousQueue核心属性和方法源码的分析的代码

2023-06-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除