qq118009617-CSDN博客

原创电力预测大赛经验教训与心得总结

摘要：本文总结了电力预测竞赛中的实战经验，重点包括：1）数据划分技巧，建议保留独立验证集；2）发现直接预测优于滚动预测的反直觉现象；3）警惕验证集数据泄露问题；4）预测精度随时间衰减的应对策略；5）特征工程要点，包括细粒度预测和多源数据利用；6）强调多模型融合的重要性。特别指出气象数据需分时段建模，短期预测依赖滞后特征，长期预测则需转向时间特征。最终成绩提升关键在于根据预测可靠性动态调整交易策略。

2026-05-08 22:13:41 415 1

原创第二课，openclaw的skill安装及拓展尝试

飞书和 OpenClaw 对接的前提是 OpenClaw 环境装对：别着急搞飞书，先把 Ubuntu 里的 OpenClaw 装成功、大模型 API Key 配好能本地用了，再去接飞书，不然基础没打好，飞书机器人也跑不起来；给飞书机器人装技能别装错类型：装技能还是用 ClawHub 命令，但别瞎装带 “feishu” 的技能（除非你已经接好飞书），而且装的技能是给飞书机器人用的，触发方式是在飞书里喊，不是本地终端；但：如果本地使用openclaw，不接飞书也几乎没什么损失，绝大多数技能照样用；

2026-03-22 02:38:42 479

原创机器人仿真课01，安装环境和habitat_lab以及habitat_sim的基本要素

笔记里把数据集、任务、环境、模拟器、Agent这几块的默认配置都拆解了一遍，比如默认的步长是0.25米，转向角度10度，智能体高度1.5米，传感器分辨率256x256这些。代码跑起来的流程大概是：先加载YAML配置，然后初始化Env类，这时候会把模拟器、任务、传感器都实例化好，最后把这些配置转成Habitat-sim能识别的格式，底层还是靠Habitat-sim来跑仿真。它里面已经内置了不少现成的任务，比如点导航、物体导航、视觉语言导航这些，还有一些交互任务像开门、拾取放置之类的。

2026-03-19 20:31:44 247

原创 openclaw课1：openclaw安装与各种预习试探

本文记录了将OpenClaw应用于金融量化投研的探索过程。首先通过基础测试验证功能，随后重点配置安全措施：修改SOUL.md、user.md和IDENTITY.md三个核心文件，制定金融场景下的操作规范和安全准则。接着升级模型至DeepSeek-V3以提升金融分析能力。最后以生成《2026年中国白酒行业投资机会分析》PPT为例进行测试，成功输出包含10页内容的MD格式报告，涵盖市场规模、竞争格局等核心分析，验证了OpenClaw在金融研究场景的可行性。整个过程强调安全合规，为AI辅助金融研究提供了实践参考。

2026-03-18 18:35:57 432

原创 task06知识图谱和实践总结

系统是模块化设计，有六大核心模块，能智能分析查询的复杂度和关系密集度，匹配图 RAG 检索、组合检索或传统混合检索策略，还带降级机制，数据从 Neo4j 提取后构建结构化文档、分块再做 Milvus 向量索引，支持交互式问答和流式输出答案。这个菜谱图 RAG 系统搭了 Neo4j+Milvus 双库，配了六核心模块，能智能分析查询复杂度选检索策略，复杂查用多跳推理，中等查组合检索，简单查办底，还带降级机制，数据从图库转结构化文档再建向量索引，支持交互式问答。再做图谱检索，定位核心实体，找相关子图和路径；

2026-03-03 02:27:15 594

原创 rag第5课，rag实战学习

然后到索引构建与优化，先把文本怎么转成向量，再拓展到图片加文字的多模态嵌入，接着教搭向量数据库，还拿 Milvus 做了实际操作，最后学怎么给索引调优，让检索速度更快。之后是检索进阶，全是实用技巧，比如稠密加稀疏的混合检索、怎么让系统更懂用户的查询、自然语言转 SQL，还有怎么优化查询策略，把检索的精准度提上去。通过实战学 RAG 基础、先配环境，把开发环境搭好，快速做一个简单 RAG 的四步走方法，顺带讲了 Python 虚拟环境怎么部署，让人有了个整体概念，把基础打牢。

2026-02-28 09:31:56 71

原创 rag第四课：rag的混合检索等

解决办法就是给AI一张"地图"——把表结构、字段含义、还有以前写过的类似SQL都给它看，这样它就能更准确地理解你的意思，写出正确的查询语句了。混合检索让它们互补，比如搜"西红柿炒蛋"时，既能找到字面匹配的，也能找到"番茄鸡蛋"这种语义相近的，结果更准确、更懂你。解决办法就是用更明确的说法，比如"按时长升序排列的视频"，或者直接在代码里指定排序逻辑。比如你想搜"2022年发布的机器学习论文"，它会自动把"2022年"提取出来做过滤条件，"机器学习论文"拿去做语义搜索，这样就能精准找到你要的东西了。

2026-02-25 02:57:41 61

原创 vibe coding第五课：完整项目实战

3.对话历史的持久化也很重要，这里重点说一下，纯前端项目的话，用LocalStorage就很合适，操作简单，能把用户数据存在浏览器里，就算刷新页面，之前的记录也不会丢，不过有个缺点得记清楚，就是没法跨设备同步，换个手机或电脑就看不到之前的数据了。1.最基础的就是增加“等待”和“反馈”，用户操作之后，不能让人家干等着没动静，也不能操作完不知道成没成功，得有明确的提示，比如加载中的动画、操作成功或失败的提醒，这样才够贴心。最后，原型做好之后，一定要收集反馈、快速迭代，这才是让原型越来越完善的关键。

2026-02-24 00:01:19 291

原创 rag第三章，向量嵌入、多模态嵌入、向量数据库、索引优化

向量嵌入就是把文本、图片等复杂数据，转成计算机能处理的固定长度数字向量，核心规律是，常用余弦相似度衡量，是 RAG 检索的核心。在 RAG 中，先把知识库文档切块转向量存向量库，用户提问也转成向量，匹配最相似的文档块给大模型做参考，嵌入模型质量直接决定检索准确性。嵌入模型从静态词嵌入（Word2Vec，无法处理一词多义），发展到动态上下文嵌入（BERT，结合语境生成向量），再到适配 RAG 的新一代模型（需支持领域适配、多粒度 / 多模态、混合检索）。

2026-02-20 02:46:44 632

原创 agent结题课，总结与计划

作为程序员，本来已经有一定基础，但是三堂课，还是收益颇多，从最基础的 API 调用实操，到生成式大语言模型的底层技术架构，再到提升模型效果的提示词工程，一步步从基础落地到技术细节，还搞懂了很多核心概念和实操技巧，踩坑也解决了不少问题，整体把智能体开发的基础逻辑摸透了。

2026-02-15 23:45:13 328

原创动手学agent第3课，提示词工程

答：传统接口是固定代码逻辑，输参数就按预设出结果，要写代码、调试部署，适合精准固定场景（比如登录），优点是稳，缺点是死板；提示工程靠提示词引导模型推理，不用写复杂代码、不用部署，适合写代码、排bug这类推理生成场景，优点是灵活高效，缺点是输出不稳定、易瞎猜。比如刚让模型写代码，又立马让它排bug，没衔接好，模型输出混乱，没法精准响应。比如让模型整理接口参数，没要求格式，结果内容混杂，还得手动整理，得不偿失。2. 自我一致性：多让模型答几次，选最准的，提示词直接说“多回答几次，选最准确的输出”；

2026-02-15 12:19:45 391

原创 vibe code第四课给电商平台加ai功能

需要注意的是，图像生成过程中容易出现各类异常问题，建议在AI IDE中设置显示完整的报错信息，方便复制粘贴进行修改，避免出现“生成失败”却无法得知具体原因的情况，例如可直接告知AI IDE：“不要只显示图片生成失败，每次都显示完整的失败原因，比如图片不匹配、请求错误、超时等等！这里需要补充一点，SDK是对API的封装，如果说API是原始接口，那么SDK就是一套现成的工具箱，它已将请求签名、错误处理、参数校验等繁琐细节提前做好，日常开发中，优先选择SDK而非直接调用API，能大幅节省开发时间、减少麻烦。

2026-02-14 12:52:26 529

原创 rag第二课数据加载和文字截断

策略通常会提供更高质量的结构化（标题段落等文本带着比较明显的条理结构化分类的文本）的解析结果，包括更准确的文本识别和结构化信息，更全面解析质量，适合高质量结构化信息的场景，例如处理学术论文、企业合同等;1. **文档加载器的核心功能**：解析不同格式的非结构化文档（如PDF、Word、Markdown、HTML等）为结构化数据，并提取元数据，如文档来源、页码、作者等。基于文档结构的分块（如使用Markdown标题）则利用文档的层级结构，为每个块注入语义元数据，提升搜索的精确性。函数后，尝试使用不同的。

2026-02-13 23:41:38 73

原创 vibe coding第三课

最后一步就是把能用的原型变成好用、专业的产品，完整走一遍用户操作全流程，把卡顿、异常的地方都让 AI 修复，确保每次刷新都能像新用户一样，顺畅走完所有流程得到预期效果。你完全可以根据自己的需求，随意调整网页功能，有想法直接跟 AI 说就行。等核心玩法落地后，就可以扩展多页面应用了，之前点击无效的设置页、其他跳转页，都可以让 AI 按照业务需求补充实现，直到所有页面能正常跳转、功能能正常交互。功能写得差不多后，就自己手动点一点关注的功能和按钮，检查交互是否正常，有无法操作的地方，直接跟 AI 沟通修复就行。

2026-02-13 22:49:09 47

原创 vibe coding 第二课

我们会先讲清普通 IDE 和 AI IDE 的区别，搞懂为啥 AI IDE 能让效率翻倍；最后再分享几句和 AI 对话的实用技巧，少走弯路。最后说下 Coding Plan：这是各大云厂商出的订阅套餐，买了之后在有效期内就能不限次或高频次用他们的大模型 API。和按 Token 计费不一样，它就是包月固定费用，放心大胆用，不用每次调用都算钱。普通 IDE 对老程序员来说太简单了，我就不多啰嗦，直接说现在主流的 AI IDE：Trae、Cursor、VS Code + Cline 这几款。

2026-02-13 11:27:00 70

原创 vibe coding第一课

1现在能靠 AI 对话编程，不用记语法、配环境，网页端就能实现，这叫 Vibe Coding，核心是把需求说清楚，AI 来写代码；5有不少好用的 AI 编程平台，z.ai 能做全栈开发，Google AI Studio 适合快速原型，Coze 能零代码搭 Bot，各有各的特色。3选大模型要关注两个点，上下文是它的短期记忆，太长会忘细节，指令遵循能力决定它能不能按要求精准做事，工业级应用很看重这个；过程：出错修改完善了好几次，ai大大降低了编程的难度，可以构思，编码，查错等。

2026-02-12 16:26:27 582

原创 rag学习第一课

RAG（检索增强生成）作为解决大语言模型（LLM）固有缺陷的核心技术范式，核心通过融合 LLM 内部参数化知识与外部非参数化知识，从根源上解决了 LLM 知识静态、易产生幻觉、领域专业性不足等问题，是介于提示词工程与模型微调之间的高性价比技术选型，也是当前 LLM 落地行业场景的关键支撑技术。

2026-02-11 17:56:34 505

原创 agent学习第二章

例如在"猫在沙发上睡觉"中，模型能够捕捉"猫"与"睡觉"、"沙发"与"睡觉"之间的语义关联。"对应ID为0，"""对应ID为1。模型逐token生成，每次将新生成的token加入输入序列，重复此过程直到生成完整文本。温度参数（Temperature T）：调整概率分布的平滑度，公式为： P(x) = exp(logits/T) / Σexp(logits/T)这些技术构成了现代生成式大语言模型的完整技术栈，从底层的Transformer架构到上层的应用系统，形成了一个成熟的技术生态。

2026-02-11 17:26:59 374

原创 agent第一课

本次实操基于阿里云DSW环境，通过Python调用DeepSeek API开发基础问答程序。核心实现包括：1）封装QAgent类建立API连接；2）实现ask方法完成问答交互；3）解决索引变量未定义等典型错误。技术认知方面，区分了基础问答程序与大模型智能体的本质差异：前者仅支持单轮问答，后者具备记忆、规划和工具调用等能力。本次实践完成了从API调用到基础智能体开发的技术落地，为后续复杂智能体开发奠定基础。

2026-02-11 08:20:07 547

原创 Habitat-Sim 基础实践总结

机器人基础

2026-01-16 02:59:16 356

原创多目标模型的学习

省车省油钱，但鲜花怕热、冰块怕化、炸药怕碰，温度湿度只能取中间值，结果花蔫了、水洒了、炸药还差点晃爆，互相拖后腿，这叫“跷跷板”。总结：从“一辆货车”到“旋钮混舱”，再到“贴封条的分层物流”，核心思路只有一句话——先共享后隔离，越隔越细，让包裹既能同路，又不互相添麻烦。行为上：CGC 是“单层隔离”，PLE 是“多层渐进隔离”——后者把 CGC 当积木，纵向堆叠，让共享与专属知识逐层提纯。，把每一段的预测都绑在“曝光”这张大地图上，既不怕样本跑偏，也不怕数据太少，送得稳、送得准，还省油钱。

2025-09-30 23:59:38 447

原创大模型微调学习

相比全量微调，LoRA 表达能力受限，复杂任务可能效果不佳。：LoRA 只训练少量参数，显存占用低，训练速度快。：LoRA 权重可合并回原模型，推理速度无显著下降。先查模型的特定的指令微调格式，按格式构造数据。：LoRA 模型对未见过的新任务泛化能力较弱。：若基座模型能力弱，LoRA 提升空间有限。：LoRA 权重可插拔，便于多任务切换。仅训练插入的低秩矩阵，冻结原模型参数。保存 LoRA 权重（非完整模型）。：原模型参数不变，避免灾难性遗忘。加载原模型和 LoRA 权重。（用于可视化训练过程）等。

2025-09-27 03:00:36 378

原创精排模型学习

校长（候选商品）拿出一条项链，发现“戒指班长”最相关，就把戒指班长的意见放大，裤子班长先靠边。做法：先把历史当“老乡”用 DIN 跑通 baseline，发现用户爱变心就上 DIEN 小火车，如果一天来意多端再让 DSIN 当老师分班开会——三步升级。淘宝“猜你喜欢”、抖音“推荐视频”、头条“推荐新闻”——只要一排商品或内容，都能用。“今天我要买键盘，把我过去看鼠标、看显卡的老乡全拉来撑场面，看跑鞋的老乡先靠边。会话兴趣激活层——候选商品当校长，给每个班长打分，谁分高听谁的。

2025-09-27 00:32:05 746

原创提示词工程总结与拓展

提示词 = 任务【必选】＋生成主体【必选】＋细节【可选】＋形式【可选】+角色扮演+分布思考+格式约束+例子。正例：“请把下列段落润色为 IEEE 会议论文的学术中文，保持原意，仅替换用词与句式，不增减信息”。把变量槽位做成模板字符串，供前端表单、API 查询参数直接替换，实现“零代码”上线新活动。杜绝歧义、省略、黑话。实现方法：抽象出“变量槽位”，如【主题】【受众】【字数】，其余部分固化。：去掉口语、冗余，保留逻辑，一次通过 Turnitin 语法检测。：品牌调性、受众、平台不清楚，输出千篇一律。

2025-09-24 00:27:56 842

原创推荐系统task2学习总结

如何在庞大的物品库中，快速找到与用户兴趣高度匹配的候选集。传统的协同过滤方法虽然有效，但在面对数亿用户和数千万商品时，计算复杂度成为不可逾越的障碍。u2i召回的演进历程，本质上是一个将复杂的“匹配”问题逐步简化为高效“搜索”问题的过程。通过隐向量内积把二阶交互拆成“用户侧和＋物品侧和＋交叉内积”，交叉部分恰好满足 〈u,v〉 形式，首次证明“复杂评分可压缩成两支向量”。i2i召回解决的是“买了这个商品的人还会买什么”的问题，u2i召回直面的则是推荐系统的核心命题——“这个用户会喜欢什么商品”。

2025-09-21 23:58:42 484

原创大模型云部署和私有部署

大模型云部署SiliconFlow 平台+OpenAI 兼容接口的“五分钟上手”方案：申请密钥、装库、写三行代码，就能让 8B 参数的 Qwen3 在屏幕上说出“你好”。这一步看似“Hello World”，却解决了初学者最容易被卡住的两大痛点——网络与硬件。无需 GPU、无需 CUDA、无需考虑显存，只要会发 HTTP 请求就能体验 2025 年最新模型的能力。作者把 temperature、max_tokens、stream 三个关键参数揉进对话封装函数，并用“温度越高越创意”一句话点透采样本质。

2025-09-21 03:00:04 260

原创推荐系统初步

快速搬来 200～500 款“他可能喝”的饮料（可乐、雪碧、新品气泡水）。：老板不仅想卖饮料，还想顾客顺手买薯片、办会员、给五星。：用户一走进超市，货架上万种商品，你不能全部摆他面前。给这 200 款饮料逐一打分，谁分高谁靠前。同时输出多个指标（点击率、转化率、好评率）。，让用户最想买的出现在第 1-3 位。，避免“只点不买”或“买后差评”。用户真爱，速度要快，精度可放宽。：柜台地方小，只能摆 10 瓶。

2025-09-17 20:56:34 214

原创大模型入门

目标：用初学者能听懂的口水话，把"大模型是什么、好在哪、怎么搭环境、怎么跑起来"一次性讲清楚。下面直接开唠。

2025-09-17 19:43:19 299

原创实在Agent实现自动化办公

安装完成后，浏览器会出现插件提示，点击开启浏览器插件。按照安装向导的提示进行操作，包括接受许可协议、选择安装路径等。安装完成后，通常会有安装成功的提示。：登录后进入输入框界面，可以直接输入问题或任务需求，实在Agent会给出相关回复。通过以上步骤，你可以快速安装并使用实在Agent，享受其带来的自动化和智能化体验。：例如“帮我查询一下北京到杭州的机票信息”，实在Agent会自动规划任务并执行。：点击左侧界面切换按钮，可以展开全操作界面，进行更复杂的功能操作。：如果任务涉及网页操作，确保浏览器插件已开启。

2025-02-27 16:01:26 1081

原创使用 Cursor 编程的心得和技巧

通过以上技巧，你可以更高效地使用 Cursor 进行编程，减少手动编写代码的工作量，提高开发效率和代码质量。使用 Cursor 进行编程时，掌握一些高效的心得和技巧可以帮助你更好地利用其强大的 AI 功能，提高开发效率和代码质量。• 反馈具体问题：如果代码有错误，提供具体的错误信息或描述问题，帮助 Cursor 更好地理解并修正。• 生成测试代码：在开发过程中，要求 Cursor 生成测试代码，确保代码的正确性和稳定性。• 代码补全：在编写代码时，Cursor 会自动补全代码片段，减少手动输入的工作量。

2025-02-15 23:31:57 859

原创 cursor，我都已经再context那里选择某个文件了，还需要用@符号来选别的文件吗？

如果你需要在当前文件中引用其他文件的内容，或者需要引入新的文件作为上下文，那么可以使用。符号来引用这个文件，因为 Cursor 已经将其作为上下文加载了。中选择了某个文件，那么在当前编辑环境中，你不需要再使用。

2025-02-13 15:18:09 413

原创 cursor+Qwen2.5

**模型版本**：推荐使用 `Qwen2.5-Coder-32B` 或更高版本，支持长上下文和复杂代码任务。- **网络问题**：若国内访问受限，可通过阿里云百炼平台或代理服务解决。### **步骤 3：获取 API Key**### **步骤 1：安装 Cursor**2. **修改 API 基础 URL**1. **申请阿里云 API Key**1. **打开 Cursor 设置**### **步骤 4：选择并验证模型**### **步骤 2：配置模型接口**

2025-02-12 14:04:13 1847

qq_29409655的博客