自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 电力预测大赛经验教训与心得总结

摘要:本文总结了电力预测竞赛中的实战经验,重点包括:1)数据划分技巧,建议保留独立验证集;2)发现直接预测优于滚动预测的反直觉现象;3)警惕验证集数据泄露问题;4)预测精度随时间衰减的应对策略;5)特征工程要点,包括细粒度预测和多源数据利用;6)强调多模型融合的重要性。特别指出气象数据需分时段建模,短期预测依赖滞后特征,长期预测则需转向时间特征。最终成绩提升关键在于根据预测可靠性动态调整交易策略。

2026-05-08 22:13:41 415 1

原创 第二课,openclaw的skill安装及拓展尝试

飞书和 OpenClaw 对接的前提是 OpenClaw 环境装对:别着急搞飞书,先把 Ubuntu 里的 OpenClaw 装成功、大模型 API Key 配好能本地用了,再去接飞书,不然基础没打好,飞书机器人也跑不起来;给飞书机器人装技能别装错类型:装技能还是用 ClawHub 命令,但别瞎装带 “feishu” 的技能(除非你已经接好飞书),而且装的技能是给飞书机器人用的,触发方式是在飞书里喊,不是本地终端;但:如果本地使用openclaw,不接飞书也几乎没什么损失,绝大多数技能照样用;

2026-03-22 02:38:42 479

原创 机器人仿真课01,安装环境和habitat_lab以及habitat_sim的基本要素

笔记里把数据集、任务、环境、模拟器、Agent这几块的默认配置都拆解了一遍,比如默认的步长是0.25米,转向角度10度,智能体高度1.5米,传感器分辨率256x256这些。代码跑起来的流程大概是:先加载YAML配置,然后初始化Env类,这时候会把模拟器、任务、传感器都实例化好,最后把这些配置转成Habitat-sim能识别的格式,底层还是靠Habitat-sim来跑仿真。它里面已经内置了不少现成的任务,比如点导航、物体导航、视觉语言导航这些,还有一些交互任务像开门、拾取放置之类的。

2026-03-19 20:31:44 247

原创 openclaw课1:openclaw安装与各种预习试探

本文记录了将OpenClaw应用于金融量化投研的探索过程。首先通过基础测试验证功能,随后重点配置安全措施:修改SOUL.md、user.md和IDENTITY.md三个核心文件,制定金融场景下的操作规范和安全准则。接着升级模型至DeepSeek-V3以提升金融分析能力。最后以生成《2026年中国白酒行业投资机会分析》PPT为例进行测试,成功输出包含10页内容的MD格式报告,涵盖市场规模、竞争格局等核心分析,验证了OpenClaw在金融研究场景的可行性。整个过程强调安全合规,为AI辅助金融研究提供了实践参考。

2026-03-18 18:35:57 432

原创 task06知识图谱和实践总结

系统是模块化设计,有六大核心模块,能智能分析查询的复杂度和关系密集度,匹配图 RAG 检索、组合检索或传统混合检索策略,还带降级机制,数据从 Neo4j 提取后构建结构化文档、分块再做 Milvus 向量索引,支持交互式问答和流式输出答案。这个菜谱图 RAG 系统搭了 Neo4j+Milvus 双库,配了六核心模块,能智能分析查询复杂度选检索策略,复杂查用多跳推理,中等查组合检索,简单查办底,还带降级机制,数据从图库转结构化文档再建向量索引,支持交互式问答。再做图谱检索,定位核心实体,找相关子图和路径;

2026-03-03 02:27:15 594

原创 rag第5课,rag实战学习

然后到索引构建与优化,先把文本怎么转成向量,再拓展到图片加文字的多模态嵌入,接着教搭向量数据库,还拿 Milvus 做了实际操作,最后学怎么给索引调优,让检索速度更快。之后是检索进阶,全是实用技巧,比如稠密加稀疏的混合检索、怎么让系统更懂用户的查询、自然语言转 SQL,还有怎么优化查询策略,把检索的精准度提上去。通过实战学 RAG 基础、先配环境,把开发环境搭好,快速做一个简单 RAG 的四步走方法,顺带讲了 Python 虚拟环境怎么部署,让人有了个整体概念,把基础打牢。

2026-02-28 09:31:56 71

原创 rag第四课:rag的混合检索等

解决办法就是给AI一张"地图"——把表结构、字段含义、还有以前写过的类似SQL都给它看,这样它就能更准确地理解你的意思,写出正确的查询语句了。混合检索让它们互补,比如搜"西红柿炒蛋"时,既能找到字面匹配的,也能找到"番茄鸡蛋"这种语义相近的,结果更准确、更懂你。解决办法就是用更明确的说法,比如"按时长升序排列的视频",或者直接在代码里指定排序逻辑。比如你想搜"2022年发布的机器学习论文",它会自动把"2022年"提取出来做过滤条件,"机器学习论文"拿去做语义搜索,这样就能精准找到你要的东西了。

2026-02-25 02:57:41 61

原创 vibe coding第五课:完整项目实战

3.对话历史的持久化也很重要,这里重点说一下,纯前端项目的话,用LocalStorage就很合适,操作简单,能把用户数据存在浏览器里,就算刷新页面,之前的记录也不会丢,不过有个缺点得记清楚,就是没法跨设备同步,换个手机或电脑就看不到之前的数据了。1.最基础的就是增加“等待”和“反馈”,用户操作之后,不能让人家干等着没动静,也不能操作完不知道成没成功,得有明确的提示,比如加载中的动画、操作成功或失败的提醒,这样才够贴心。最后,原型做好之后,一定要收集反馈、快速迭代,这才是让原型越来越完善的关键。

2026-02-24 00:01:19 291

原创 rag第三章,向量嵌入、多模态嵌入、向量数据库、索引优化

向量嵌入就是把文本、图片等复杂数据,转成计算机能处理的固定长度数字向量,核心规律是,常用余弦相似度衡量,是 RAG 检索的核心。在 RAG 中,先把知识库文档切块转向量存向量库,用户提问也转成向量,匹配最相似的文档块给大模型做参考,嵌入模型质量直接决定检索准确性。嵌入模型从静态词嵌入(Word2Vec,无法处理一词多义),发展到动态上下文嵌入(BERT,结合语境生成向量),再到适配 RAG 的新一代模型(需支持领域适配、多粒度 / 多模态、混合检索)。

2026-02-20 02:46:44 632

原创 agent结题课,总结与计划

作为程序员,本来已经有一定基础,但是三堂课,还是收益颇多,从最基础的 API 调用实操,到生成式大语言模型的底层技术架构,再到提升模型效果的提示词工程,一步步从基础落地到技术细节,还搞懂了很多核心概念和实操技巧,踩坑也解决了不少问题,整体把智能体开发的基础逻辑摸透了。

2026-02-15 23:45:13 328

原创 动手学agent第3课,提示词工程

答:传统接口是固定代码逻辑,输参数就按预设出结果,要写代码、调试部署,适合精准固定场景(比如登录),优点是稳,缺点是死板;提示工程靠提示词引导模型推理,不用写复杂代码、不用部署,适合写代码、排bug这类推理生成场景,优点是灵活高效,缺点是输出不稳定、易瞎猜。比如刚让模型写代码,又立马让它排bug,没衔接好,模型输出混乱,没法精准响应。比如让模型整理接口参数,没要求格式,结果内容混杂,还得手动整理,得不偿失。2. 自我一致性:多让模型答几次,选最准的,提示词直接说“多回答几次,选最准确的输出”;

2026-02-15 12:19:45 391

原创 vibe code第四课 给电商平台加ai功能

需要注意的是,图像生成过程中容易出现各类异常问题,建议在AI IDE中设置显示完整的报错信息,方便复制粘贴进行修改,避免出现“生成失败”却无法得知具体原因的情况,例如可直接告知AI IDE:“不要只显示图片生成失败,每次都显示完整的失败原因,比如图片不匹配、请求错误、超时等等!这里需要补充一点,SDK是对API的封装,如果说API是原始接口,那么SDK就是一套现成的工具箱,它已将请求签名、错误处理、参数校验等繁琐细节提前做好,日常开发中,优先选择SDK而非直接调用API,能大幅节省开发时间、减少麻烦。

2026-02-14 12:52:26 529

原创 rag第二课数据加载和文字截断

策略通常会提供更高质量的结构化(标题段落等文本带着比较明显的条理结构化分类的文本)的解析结果,包括更准确的文本识别和结构化信息,更全面解析质量,适合高质量结构化信息的场景,例如处理学术论文、企业合同等;1. **文档加载器的核心功能**:解析不同格式的非结构化文档(如PDF、Word、Markdown、HTML等)为结构化数据,并提取元数据,如文档来源、页码、作者等。基于文档结构的分块(如使用Markdown标题)则利用文档的层级结构,为每个块注入语义元数据,提升搜索的精确性。函数后,尝试使用不同的。

2026-02-13 23:41:38 73

原创 vibe coding第三课

最后一步就是把能用的原型变成好用、专业的产品,完整走一遍用户操作全流程,把卡顿、异常的地方都让 AI 修复,确保每次刷新都能像新用户一样,顺畅走完所有流程得到预期效果。你完全可以根据自己的需求,随意调整网页功能,有想法直接跟 AI 说就行。等核心玩法落地后,就可以扩展多页面应用了,之前点击无效的设置页、其他跳转页,都可以让 AI 按照业务需求补充实现,直到所有页面能正常跳转、功能能正常交互。功能写得差不多后,就自己手动点一点关注的功能和按钮,检查交互是否正常,有无法操作的地方,直接跟 AI 沟通修复就行。

2026-02-13 22:49:09 47

原创 vibe coding 第二课

我们会先讲清普通 IDE 和 AI IDE 的区别,搞懂为啥 AI IDE 能让效率翻倍;最后再分享几句和 AI 对话的实用技巧,少走弯路。最后说下 Coding Plan:这是各大云厂商出的订阅套餐,买了之后在有效期内就能不限次或高频次用他们的大模型 API。和按 Token 计费不一样,它就是包月固定费用,放心大胆用,不用每次调用都算钱。普通 IDE 对老程序员来说太简单了,我就不多啰嗦,直接说现在主流的 AI IDE:Trae、Cursor、VS Code + Cline 这几款。

2026-02-13 11:27:00 70

原创 vibe coding第一课

1现在能靠 AI 对话编程,不用记语法、配环境,网页端就能实现,这叫 Vibe Coding,核心是把需求说清楚,AI 来写代码;5有不少好用的 AI 编程平台,z.ai 能做全栈开发,Google AI Studio 适合快速原型,Coze 能零代码搭 Bot,各有各的特色。3选大模型要关注两个点,上下文是它的短期记忆,太长会忘细节,指令遵循能力决定它能不能按要求精准做事,工业级应用很看重这个;过程:出错修改完善了好几次,ai大大降低了编程的难度,可以构思,编码,查错等。

2026-02-12 16:26:27 582

原创 rag学习第一课

RAG(检索增强生成)作为解决大语言模型(LLM)固有缺陷的核心技术范式,核心通过融合 LLM 内部参数化知识与外部非参数化知识,从根源上解决了 LLM 知识静态、易产生幻觉、领域专业性不足等问题,是介于提示词工程与模型微调之间的高性价比技术选型,也是当前 LLM 落地行业场景的关键支撑技术。

2026-02-11 17:56:34 505

原创 agent学习第二章

例如在"猫在沙发上睡觉"中,模型能够捕捉"猫"与"睡觉"、"沙发"与"睡觉"之间的语义关联。"对应ID为0,"""对应ID为1。模型逐token生成,每次将新生成的token加入输入序列,重复此过程直到生成完整文本。温度参数(Temperature T): 调整概率分布的平滑度,公式为: P(x) = exp(logits/T) / Σexp(logits/T)这些技术构成了现代生成式大语言模型的完整技术栈,从底层的Transformer架构到上层的应用系统,形成了一个成熟的技术生态。

2026-02-11 17:26:59 374

原创 agent第一课

本次实操基于阿里云DSW环境,通过Python调用DeepSeek API开发基础问答程序。核心实现包括:1)封装QAgent类建立API连接;2)实现ask方法完成问答交互;3)解决索引变量未定义等典型错误。技术认知方面,区分了基础问答程序与大模型智能体的本质差异:前者仅支持单轮问答,后者具备记忆、规划和工具调用等能力。本次实践完成了从API调用到基础智能体开发的技术落地,为后续复杂智能体开发奠定基础。

2026-02-11 08:20:07 547

原创 Habitat-Sim 基础实践总结

机器人基础

2026-01-16 02:59:16 356

原创 多目标模型的学习

省车省油钱,但鲜花怕热、冰块怕化、炸药怕碰,温度湿度只能取中间值,结果花蔫了、水洒了、炸药还差点晃爆,互相拖后腿,这叫“跷跷板”。总结:从“一辆货车”到“旋钮混舱”,再到“贴封条的分层物流”,核心思路只有一句话——先共享后隔离,越隔越细,让包裹既能同路,又不互相添麻烦。行为上:CGC 是“单层隔离”,PLE 是“多层渐进隔离”——后者把 CGC 当积木,纵向堆叠,让共享与专属知识逐层提纯。,把每一段的预测都绑在“曝光”这张大地图上,既不怕样本跑偏,也不怕数据太少,送得稳、送得准,还省油钱。

2025-09-30 23:59:38 447

原创 大模型微调学习

相比全量微调,LoRA 表达能力受限,复杂任务可能效果不佳。:LoRA 只训练少量参数,显存占用低,训练速度快。:LoRA 权重可合并回原模型,推理速度无显著下降。先查模型的特定的指令微调格式,按格式构造数据。:LoRA 模型对未见过的新任务泛化能力较弱。:若基座模型能力弱,LoRA 提升空间有限。:LoRA 权重可插拔,便于多任务切换。仅训练插入的低秩矩阵,冻结原模型参数。保存 LoRA 权重(非完整模型)。:原模型参数不变,避免灾难性遗忘。加载原模型和 LoRA 权重。(用于可视化训练过程)等。

2025-09-27 03:00:36 378

原创 精排模型学习

校长(候选商品)拿出一条项链,发现“戒指班长”最相关,就把戒指班长的意见放大,裤子班长先靠边。做法:先把历史当“老乡”用 DIN 跑通 baseline,发现用户爱变心就上 DIEN 小火车,如果一天来意多端再让 DSIN 当老师分班开会——三步升级。淘宝“猜你喜欢”、抖音“推荐视频”、头条“推荐新闻”——只要一排商品或内容,都能用。“今天我要买键盘,把我过去看鼠标、看显卡的老乡全拉来撑场面,看跑鞋的老乡先靠边。会话兴趣激活层——候选商品当校长,给每个班长打分,谁分高听谁的。

2025-09-27 00:32:05 746

原创 提示词工程总结与拓展

提示词 = 任务【必选】+生成主体【必选】+细节【可选】+形式【可选】+角色扮演+分布思考+格式约束+例子。正例:“请把下列段落润色为 IEEE 会议论文的学术中文,保持原意,仅替换用词与句式,不增减信息”。把变量槽位做成模板字符串,供前端表单、API 查询参数直接替换,实现“零代码”上线新活动。杜绝歧义、省略、黑话。实现方法:抽象出“变量槽位”,如【主题】【受众】【字数】,其余部分固化。:去掉口语、冗余,保留逻辑,一次通过 Turnitin 语法检测。:品牌调性、受众、平台不清楚,输出千篇一律。

2025-09-24 00:27:56 842

原创 推荐系统task2学习总结

如何在庞大的物品库中,快速找到与用户兴趣高度匹配的候选集。传统的协同过滤方法虽然有效,但在面对数亿用户和数千万商品时,计算复杂度成为不可逾越的障碍。u2i召回的演进历程,本质上是一个将复杂的“匹配”问题逐步简化为高效“搜索”问题的过程。通过隐向量内积把二阶交互拆成“用户侧和+物品侧和+交叉内积”,交叉部分恰好满足 〈u,v〉 形式,首次证明“复杂评分可压缩成两支向量”。i2i召回解决的是“买了这个商品的人还会买什么”的问题,u2i召回直面的则是推荐系统的核心命题——“这个用户会喜欢什么商品”。

2025-09-21 23:58:42 484

原创 大模型云部署和私有部署

大模型云部署SiliconFlow 平台+OpenAI 兼容接口的“五分钟上手”方案:申请密钥、装库、写三行代码,就能让 8B 参数的 Qwen3 在屏幕上说出“你好”。这一步看似“Hello World”,却解决了初学者最容易被卡住的两大痛点——网络与硬件。无需 GPU、无需 CUDA、无需考虑显存,只要会发 HTTP 请求就能体验 2025 年最新模型的能力。作者把 temperature、max_tokens、stream 三个关键参数揉进对话封装函数,并用“温度越高越创意”一句话点透采样本质。

2025-09-21 03:00:04 260

原创 推荐系统初步

快速搬来 200~500 款“他可能喝”的饮料(可乐、雪碧、新品气泡水)。:老板不仅想卖饮料,还想顾客顺手买薯片、办会员、给五星。:用户一走进超市,货架上万种商品,你不能全部摆他面前。给这 200 款饮料逐一打分,谁分高谁靠前。同时输出多个指标(点击率、转化率、好评率)。,让用户最想买的出现在第 1-3 位。,避免“只点不买”或“买后差评”。用户真爱,速度要快,精度可放宽。:柜台地方小,只能摆 10 瓶。

2025-09-17 20:56:34 214

原创 大模型入门

目标:用初学者能听懂的口水话,把"大模型是什么、好在哪、怎么搭环境、怎么跑起来"一次性讲清楚。下面直接开唠。

2025-09-17 19:43:19 299

原创 实在Agent实现自动化办公

安装完成后,浏览器会出现插件提示,点击开启浏览器插件。按照安装向导的提示进行操作,包括接受许可协议、选择安装路径等。安装完成后,通常会有安装成功的提示。:登录后进入输入框界面,可以直接输入问题或任务需求,实在Agent会给出相关回复。通过以上步骤,你可以快速安装并使用实在Agent,享受其带来的自动化和智能化体验。:例如“帮我查询一下北京到杭州的机票信息”,实在Agent会自动规划任务并执行。:点击左侧界面切换按钮,可以展开全操作界面,进行更复杂的功能操作。:如果任务涉及网页操作,确保浏览器插件已开启。

2025-02-27 16:01:26 1081

原创 使用 Cursor 编程的心得和技巧

通过以上技巧,你可以更高效地使用 Cursor 进行编程,减少手动编写代码的工作量,提高开发效率和代码质量。使用 Cursor 进行编程时,掌握一些高效的心得和技巧可以帮助你更好地利用其强大的 AI 功能,提高开发效率和代码质量。• 反馈具体问题:如果代码有错误,提供具体的错误信息或描述问题,帮助 Cursor 更好地理解并修正。• 生成测试代码:在开发过程中,要求 Cursor 生成测试代码,确保代码的正确性和稳定性。• 代码补全:在编写代码时,Cursor 会自动补全代码片段,减少手动输入的工作量。

2025-02-15 23:31:57 859

原创 cursor,我都已经再context那里选择某个文件了,还需要用@符号来选别的文件吗?

如果你需要在当前文件中引用其他文件的内容,或者需要引入新的文件作为上下文,那么可以使用。符号来引用这个文件,因为 Cursor 已经将其作为上下文加载了。中选择了某个文件,那么在当前编辑环境中,你不需要再使用。

2025-02-13 15:18:09 413

原创 cursor+Qwen2.5

**模型版本**:推荐使用 `Qwen2.5-Coder-32B` 或更高版本,支持长上下文和复杂代码任务。- **网络问题**:若国内访问受限,可通过阿里云百炼平台或代理服务解决。### **步骤 3:获取 API Key**### **步骤 1:安装 Cursor**2. **修改 API 基础 URL**1. **申请阿里云 API Key**1. **打开 Cursor 设置**### **步骤 4:选择并验证模型**### **步骤 2:配置模型接口**

2025-02-12 14:04:13 1847

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除