自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 一步一步学习使用FireMonkey动画() 用实例理解动画的运行状态

上一篇内容,我们详细讨论了怎么使用envoy做负载均衡,并且记录详细的地址,其中还解决了一个问题,那就是怎么让envoy获取真实后端pod ip地址,后面使用headless service,既使用了service的服务发现能力,又不使用service的负载均衡能力。这里展示了怎么使用consul作为服务发现,不管是用headless还是consul,都是dns的服务发现,在consul的例子中,将固定域名(.service.consul)引导至consul提供的dns服务,从而实现。

2026-03-12 20:16:10 171

原创 记一次 .NET 某放射治疗光学定位软件 卡死分析

线性代数求解器的深度优化:能够自动选择最优线性求解器,对于小规模稠密问题,可以配置 DENSE_NORMAL_CHOLESKY,使用普通 Cholesky 求解,对于大规模稀疏问题(如 SLAM、Bundle Adjustment),可以配置 SPARSE_NORMAL_CHOLESKY,实现稀疏 Cholesky 求解。精度是用户最为关心的问题,ceres::Covariance是 Ceres 提供的一个后处理工具类,用于在优化完成后估计参数的协方差矩阵,从而得到每个参数的不确定性(标准差)。

2026-03-12 20:12:32 186

原创 基于 JuiceFS 构建 AI 推理:多模态复杂 I/O、跨云与多租户支持

和 Keyed State 类似,想要创建一个 Operator State,同样也需要一个 StateDescriptor,同时,需要实现 CheckpointedFunction,它提供了两个方法,分别是在 checkpoint 时 调用的 snapshotState() 和 自定义函数初始化时调用的 initializeState()。这里还有一个方法值得注意,就是 isRestored(),它是用来判断当前任务是否是从故障中恢复的,如果是,我们需要执行故障恢复相关的逻辑。

2026-03-11 11:32:10 308

原创 vivo 前端三剑客发展历程及原理揭秘

为了扩展应用,我们可以使用 Redis Pub/Sub(发布/订阅)来管理多个 WebSocket 服务器之间的消息分发。每次客户端发送请求(例如,当你加载网页或发送消息时),它都会与服务器建立新连接,处理请求,并在数据发送完成后关闭连接。当新客户端连接时,它会被添加到客户端列表中,当任何客户端发送消息时,该消息会广播给所有连接的客户端。为此,我们将使用 MySQL 在数据库中持久化聊天消息。借助 PHP 和 WebSocket,你拥有了创建可扩展、实时应用的基础,这些应用可以提供无缝的用户体验。

2026-03-11 11:27:13 316

原创 VTK开发笔记(五):示例Cone,熟悉观察者模式,在Qt窗口中详解复现对应的Demo

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-10 13:15:32 178

原创 我的一个oier朋友

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-10 13:10:00 197

原创 结合实例学习F#(一) --快速入门

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-09 13:10:09 169

原创 前端性能分析工具:dynaTrace Ajax Edition

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-09 13:05:05 362

原创 NIIT毕业学员的自白:+=(我是一个毕业了年多的学员)

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-08 11:19:40 249

原创 那个我们爱的Silverlight

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-08 11:13:56 327

原创 ASP.NET MVC 路线图

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-07 12:55:38 208

原创 .Net项目分层与文件夹结构大全(最佳架子奖,吐槽奖,阴沟翻船奖揭晓)

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-07 12:50:02 185

原创 每个人都应该懂点函数式编程

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-06 12:53:56 169

原创 不是技术也能看懂云计算,大数据,人工智能

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-06 12:48:48 367

原创 第三人称——骑马系统以及交互动画

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-05 12:11:29 209

原创 .NET 新增功能系列文章——C# 中的新增功能

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-05 12:05:30 375

原创 我和AI不得不说的故事:现在是最好的时代也是最坏的时代

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-04 12:06:25 204

原创 n,以及用户的swap交易。 Factory 首先来看一下Factory合约,定义了四个变量: address public fee ...

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-04 12:00:57 358

原创 基于大模型的电信网络诈骗预警技术研究

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-03 22:02:31 197

原创 哥本哈士奇(aspnetx)

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-03 21:52:08 350

原创 小爱同学连接电脑进行交互 教程

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-02 12:49:05 332

原创 打破软件“收费”羞愧感,勇敢要钱

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-02 12:43:46 287

原创 一生一芯学习:程序,运行时环境与AM(一)

因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。

2026-03-01 11:13:25 345

原创 解密prompt系列. 手搓代码沙箱与FastAPI-MCP实战

根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。

2026-03-01 11:06:41 594

原创 uni-app x使用uview-plus

单击知识库检索节点,配置输入下方Query变量参数值为意图识别节点的输出output,然后点击知识库右侧的+按钮,在弹出的选择知识库页面中添加刚刚创建的知识库。智能客服助手的搭建其实有很多方式,比如使用fastgpt、dify这样的智能体平台也是可以的,但是选择coze是一个非常简便、快捷的方案。第二、技术的发展绝对不是跳跃式的,而是建立在前一阶段的基础上的,是一种渐进式的发展。而,智能体就是对话的载体,MCP就是业务数据和智能体的桥梁,让传统的业务接口,通过对话的方式,实现业务交互。

2026-02-28 21:33:38 259

原创 丐版 OI 技巧 / 杂项部分总结 + 作者学习笔记

这样不断的删除直到无法再进行投票,如果数组为空,则没有任何元素出现的次数超过该数组长度的一半。所以当一个屋子的闹鬼次数增加时,我们把那些可能会触发警报的警报器拿出来,判断是否触发警报,如果没触发,那么重新计算。25. dp[x][y] 两维限制转化为 dp[x] 一维限制,dp[x] 记录 可行的 y 的最小值。堆的删除可以使用懒惰删除,维护每个监视器的最新阈值编号(出队次数)、以及堆中每个阈值信息的编号即可。摩尔投票法的基本思想很简单,在每一轮投票过程中,从数组中找出一对不同的元素,将其从数组中删除。

2025-12-14 22:36:32 322

原创 STM32F103ZET6 + W5500编程遇到的问题与解决过程

上位机windows操作系统,使用VS2022的C++编程,设置断线重连,有的时候能马上连接,有的时候要等半分钟才能连接成功,查看单片机的调试串口输出,可以看到W5500的网络状态卡在了SOCK_SYNRECV处很长时间,直到超时关闭连接后,上位机才能再次连接成功。将上位机连接超时从1秒改成5秒后,连接延迟的现象有所改善,但是仍然会出现,估计是在单片机等待连接再次建立的时候,刚好出现在超时临界点,导致接收不到SOCK_SYNRECV的应答信号,就一直卡在那里了,决定使用下面的思路解决。

2025-12-14 22:35:54 450

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除