- 博客(27)
- 收藏
- 关注
原创 一步一步学习使用FireMonkey动画() 用实例理解动画的运行状态
上一篇内容,我们详细讨论了怎么使用envoy做负载均衡,并且记录详细的地址,其中还解决了一个问题,那就是怎么让envoy获取真实后端pod ip地址,后面使用headless service,既使用了service的服务发现能力,又不使用service的负载均衡能力。这里展示了怎么使用consul作为服务发现,不管是用headless还是consul,都是dns的服务发现,在consul的例子中,将固定域名(.service.consul)引导至consul提供的dns服务,从而实现。
2026-03-12 20:16:10
171
原创 记一次 .NET 某放射治疗光学定位软件 卡死分析
线性代数求解器的深度优化:能够自动选择最优线性求解器,对于小规模稠密问题,可以配置 DENSE_NORMAL_CHOLESKY,使用普通 Cholesky 求解,对于大规模稀疏问题(如 SLAM、Bundle Adjustment),可以配置 SPARSE_NORMAL_CHOLESKY,实现稀疏 Cholesky 求解。精度是用户最为关心的问题,ceres::Covariance是 Ceres 提供的一个后处理工具类,用于在优化完成后估计参数的协方差矩阵,从而得到每个参数的不确定性(标准差)。
2026-03-12 20:12:32
186
原创 基于 JuiceFS 构建 AI 推理:多模态复杂 I/O、跨云与多租户支持
和 Keyed State 类似,想要创建一个 Operator State,同样也需要一个 StateDescriptor,同时,需要实现 CheckpointedFunction,它提供了两个方法,分别是在 checkpoint 时 调用的 snapshotState() 和 自定义函数初始化时调用的 initializeState()。这里还有一个方法值得注意,就是 isRestored(),它是用来判断当前任务是否是从故障中恢复的,如果是,我们需要执行故障恢复相关的逻辑。
2026-03-11 11:32:10
308
原创 vivo 前端三剑客发展历程及原理揭秘
为了扩展应用,我们可以使用 Redis Pub/Sub(发布/订阅)来管理多个 WebSocket 服务器之间的消息分发。每次客户端发送请求(例如,当你加载网页或发送消息时),它都会与服务器建立新连接,处理请求,并在数据发送完成后关闭连接。当新客户端连接时,它会被添加到客户端列表中,当任何客户端发送消息时,该消息会广播给所有连接的客户端。为此,我们将使用 MySQL 在数据库中持久化聊天消息。借助 PHP 和 WebSocket,你拥有了创建可扩展、实时应用的基础,这些应用可以提供无缝的用户体验。
2026-03-11 11:27:13
316
原创 VTK开发笔记(五):示例Cone,熟悉观察者模式,在Qt窗口中详解复现对应的Demo
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-10 13:15:32
178
原创 我的一个oier朋友
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-10 13:10:00
197
原创 结合实例学习F#(一) --快速入门
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-09 13:10:09
169
原创 前端性能分析工具:dynaTrace Ajax Edition
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-09 13:05:05
362
原创 NIIT毕业学员的自白:+=(我是一个毕业了年多的学员)
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-08 11:19:40
249
原创 那个我们爱的Silverlight
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-08 11:13:56
327
原创 ASP.NET MVC 路线图
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-07 12:55:38
208
原创 .Net项目分层与文件夹结构大全(最佳架子奖,吐槽奖,阴沟翻船奖揭晓)
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-07 12:50:02
185
原创 每个人都应该懂点函数式编程
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-06 12:53:56
169
原创 不是技术也能看懂云计算,大数据,人工智能
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-06 12:48:48
367
原创 第三人称——骑马系统以及交互动画
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-05 12:11:29
209
原创 .NET 新增功能系列文章——C# 中的新增功能
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-05 12:05:30
375
原创 我和AI不得不说的故事:现在是最好的时代也是最坏的时代
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-04 12:06:25
204
原创 n,以及用户的swap交易。 Factory 首先来看一下Factory合约,定义了四个变量: address public fee ...
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-04 12:00:57
358
原创 基于大模型的电信网络诈骗预警技术研究
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-03 22:02:31
197
原创 哥本哈士奇(aspnetx)
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-03 21:52:08
350
原创 小爱同学连接电脑进行交互 教程
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-02 12:49:05
332
原创 打破软件“收费”羞愧感,勇敢要钱
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-02 12:43:46
287
原创 一生一芯学习:程序,运行时环境与AM(一)
因此,Agent的数据和训练目标 均服务于 如何使Agent学会更好的使用工具与外界交互,从而利用外界的信息更好地完成任务。使用rl教会模型最后一种能力(工具间的协调调用,因为此任务比较难学习,需要大量的探索以及较高的泛化性要求)利用模型内部知识+外部知识(R) 根据q生成下一步的工具调用/答案 的能力 (step-wise)而训练目标体现在(1)数据集的构建方案(2)训练策略(loss)相较于传统的single-step的数据及其sft RL的训练方式。所以Agent的目标(需要的推理能力)分为三类。
2026-03-01 11:13:25
345
原创 解密prompt系列. 手搓代码沙箱与FastAPI-MCP实战
根据论文及实验经验,建议将LoRA同时作用于注意力层与MLP层(如target_modules=["q_proj","k_proj","v_proj","o_proj","gate_proj","up_proj","down_proj"]),以有效提升模型精度。优化后,模型训练速度提升2倍,显存占用降低70%。传统大语言模型微调往往面临硬件要求高、迭代速度慢和资源受限等挑战,而Unsloth通过高效的底层实现和友好的接口设计,显著降低了微调的技术门槛,使更多人能够高效、低成本地训练属于自己的定制模型。
2026-03-01 11:06:41
594
原创 uni-app x使用uview-plus
单击知识库检索节点,配置输入下方Query变量参数值为意图识别节点的输出output,然后点击知识库右侧的+按钮,在弹出的选择知识库页面中添加刚刚创建的知识库。智能客服助手的搭建其实有很多方式,比如使用fastgpt、dify这样的智能体平台也是可以的,但是选择coze是一个非常简便、快捷的方案。第二、技术的发展绝对不是跳跃式的,而是建立在前一阶段的基础上的,是一种渐进式的发展。而,智能体就是对话的载体,MCP就是业务数据和智能体的桥梁,让传统的业务接口,通过对话的方式,实现业务交互。
2026-02-28 21:33:38
259
原创 丐版 OI 技巧 / 杂项部分总结 + 作者学习笔记
这样不断的删除直到无法再进行投票,如果数组为空,则没有任何元素出现的次数超过该数组长度的一半。所以当一个屋子的闹鬼次数增加时,我们把那些可能会触发警报的警报器拿出来,判断是否触发警报,如果没触发,那么重新计算。25. dp[x][y] 两维限制转化为 dp[x] 一维限制,dp[x] 记录 可行的 y 的最小值。堆的删除可以使用懒惰删除,维护每个监视器的最新阈值编号(出队次数)、以及堆中每个阈值信息的编号即可。摩尔投票法的基本思想很简单,在每一轮投票过程中,从数组中找出一对不同的元素,将其从数组中删除。
2025-12-14 22:36:32
322
原创 STM32F103ZET6 + W5500编程遇到的问题与解决过程
上位机windows操作系统,使用VS2022的C++编程,设置断线重连,有的时候能马上连接,有的时候要等半分钟才能连接成功,查看单片机的调试串口输出,可以看到W5500的网络状态卡在了SOCK_SYNRECV处很长时间,直到超时关闭连接后,上位机才能再次连接成功。将上位机连接超时从1秒改成5秒后,连接延迟的现象有所改善,但是仍然会出现,估计是在单片机等待连接再次建立的时候,刚好出现在超时临界点,导致接收不到SOCK_SYNRECV的应答信号,就一直卡在那里了,决定使用下面的思路解决。
2025-12-14 22:35:54
450
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅