WhyteHighmore-CSDN博客

原创 nanobot源码与框架解读

根据代码分析，以下是 nanobot 框架从 CLI 入口的完整调用流程：主体流程CLI 入口 (cli/commands.py)│├─► nanobot agent → 直接交互模式├─► nanobot gateway → 启动网关服务（支持多渠道）└─► nanobot onboard → 初始化配置关键代码文件模块文件作用CLI 入口定义所有 CLI 命令 (agent, gateway, onboard 等)消息总线。

2026-04-01 20:45:59 349

原创 openclaw论文总结&姚顺雨论文总结

OpenClaw框架是一个整合了多项前沿AI技术的智能体系统。它以ReAct框架为行动循环核心，通过Chain of Thought和Tree of Thoughts进行复杂推理与规划。其工具调用能力借鉴了Toolformer的自主学习机制，并利用Reflexion和Self-Refine实现自我反思与迭代优化。框架的总体架构受到统一认知架构和语言智能体理论指导，其综合能力在τ-bench、SWE-bench等多个现实任务基准上得到验证。

2026-04-01 20:42:44 402

原创扩散模型Diffusion

本文综述了扩散概率模型的基本原理、主要范式及研究进展。扩散模型受非平衡热力学启发，通过前向过程逐步添加噪声扰动数据分布，再通过反向过程学习恢复数据结构，可视为深度变分自编码器。当前主要范式包括去噪扩散概率模型(DDPM)和基于得分的生成模型(SDE)。研究重点集中在采样加速、似然最大化和数据泛化增强三个方向：通过优化SDE离散化方案加速采样；设计变分下界优化对数似然；开发特征空间统一和数据依赖转换核等方法处理数据限制。文中指出噪声添加次数是关键超参数，需在模型准确性和数据多样性间取得平衡。

2026-01-23 17:38:45 228

原创生成对抗网络GAN总结

摘要：GAN的发展经历了DCGAN、WGAN到WGAN-GP的演进。DCGAN引入卷积网络和BatchNorm改进生成质量，但仍存在模式坍塌和训练不稳定问题。WGAN改用EM距离替代JS散度，通过权重裁剪稳定训练。WGAN-GP进一步用梯度惩罚取代权重裁剪。StyleGAN则通过Mapping层转换潜变量，在Synthesis层分别控制风格和噪声。这些改进逐步解决了GAN训练中的梯度消失、模式坍塌等关键问题，提升了生成质量和稳定性。（149字）

2026-01-23 17:37:04 54

原创深度学习算法总结

影像深度学习算法总结

2026-01-23 17:35:58 364

原创图像对抗样本常见算法总结

对抗样本生成可分为白盒（FGSM、PGD等）、黑盒（单像素攻击等）和灰盒方法，按目标分为有/无目标攻击，按方式分为梯度、优化和决策面三类。不同方法在信息掌握程度和图片攻击策略上存在差异。

2026-01-23 17:21:19 59

原创数据安全共享策略

本文摘要了数据安全共享的三大防护技术。在数据防篡改方面，介绍了基于MD5的加签/验签机制和不同防篡改技术的对比；针对数据防越权，分析了四种典型Web攻击方法（隐藏URL、直接对象引用等）及六项防御措施；对于数据防失真，重点讨论了一种应用于卫星DTN紧急通信的分布式信任管理方案(DTMS)，该方案通过信任度计算和恶意节点过滤来降低数据缺失率。全文从技术实现层面系统性地阐述了保障数据安全共享的关键方法。

2026-01-23 16:59:38 508

原创星群区块链策略

摘要卫星区块链技术结合了P2P网络、分布式账本和共识机制等区块链特性，应用于太空领域。关键技术包括哈希算法、PoW/PoS共识机制和加密技术。主要应用方向包括：NASA研究的空间物体位置追踪、卫星星座自动控制、军事数据安全传输等。具体项目如卫星防碰撞系统、小卫星星座验证、NASA多传感器架构研究，以及移动卫星通信安全框架等。这些应用通过区块链确保太空数据完整性、通信安全和自动化控制，为卫星网络提供了新型安全解决方案。（149字）

2026-01-23 16:56:31 47

原创星群边缘计算策略

本文探讨了边缘计算架构在卫星通信中的应用。边缘计算将云计算下沉至靠近用户的网络边缘节点（如基站、边缘服务器等），可实现内容缓存、计算卸载和数据安全等功能。文章分析了卫星边缘计算的分层设计，重点讨论了路由切换时的四种场景组合和3GPP LTE切换协议在低轨卫星通信中的适应性。同时提出了卫星切换需考虑的自由空间损耗、多径效应等关键因素，并总结了五种任务切换准则（最小负荷、最小距离等）。该架构通过将计算任务迁移至网络边缘，有效平衡了计算资源需求与传输效率。

2026-01-23 16:54:38 221

原创国外LEOS发展概述（SpaceX与Oneweb公司对比）

SpaceX和OneWeb是全球两大低轨卫星互联网项目。SpaceX的Starlink计划分三阶段部署4.2万颗卫星，第一阶段1584颗550km轨道Ka/Ku卫星已提供300Mbps服务，最终将实现全球覆盖。OneWeb计划分三阶段部署超2000颗1200km轨道卫星，第一阶段648颗Ku/Ka卫星可提供500Mbps服务。两者均采用多频段组网，SpaceX时延更低（15ms），OneWeb当前时延约50ms。这些星座将为全球提供高速宽带服务，并获军方关注，SpaceX已获美国空军2870万美元测试合同。

2026-01-23 16:42:16 605

原创低轨卫星产业基础介绍

低轨卫星互联网（LEO）通过250-2000公里高度的卫星星座，为全球提供高速低延迟（10-40ms）的网络覆盖，解决40亿人无法上网的问题。相比传统GEO卫星（时延205-280ms），LEO在极地覆盖和时延方面优势显著。SpaceX的Starlink（550-1325km）已发射1445颗卫星，计划总数达12000颗；OneWeb（1200km）计划部署720颗。国际竞争激烈，轨道和Ku/Ka频段资源日趋紧张，预计2029年近地轨道将部署约57000颗卫星。中国"鸿雁"（1100km

2026-01-23 16:36:52 507

原创专利查询途径总结

专利查询途径总结

2026-01-23 16:30:04 70

原创目标检测参数介绍与应用实践（以yolo为例）

模型版本推荐使用场景硬件要求性能特点YOLOv12n移动端、嵌入式低速度优先YOLOv12s边缘计算、轻量服务器中低平衡型YOLOv12m常规服务器应用中等均衡型YOLOv12l高性能服务器中高精度优先YOLOv12x研究、高性能计算高极致精度53.70MB推荐使用场景4个月前下载40.90MB4个月前下载5.60MB4个月前下载19.01MB4个月前下载119.32MB4个月前下载代码版# 训练。

2025-12-31 16:28:29 434

原创 dataphin理论笔记

采用维度事实建模理论，对维度、维度属性、业务过程、指标字段等进行严格的标准化、规范化定义，保障资产质量，避免数据指标定义的二义性。通过可视化建模工具，系统自动生成代码执行数据生产，实现"设计即开发"。

2025-12-31 16:10:39 385

原创 chatbi调研对比（SuperSonic、WrenAI、Dataherald、Chat2DB、Vanna、LangChain SQL和Langchain-Chatchat等）

追求开箱即用的产品体验BI平台需求：选择SuperSonic或WrenAI。它们提供了超越SQL生成的完整BI能力，如语义层和可视化。数据库管理/查询工具需求：选择Chat2DB（功能全面）或SQL Chat（体验纯粹）。寻求技术组件进行集成开发构建专用NL2SQL引擎：选择Dataherald（企业级API）或Vanna（轻量级Python框架）。在现有AI应用中添加数据库能力：如果项目基于LangChain，直接使用组件是最佳选择。用于研究和学习：从开始，全面了解领域动态，然后再选择具体的技术路线。

2025-12-31 16:03:49 1132

原创 Deepseek强化微调的关键超参数介绍

本内容主要介绍Deepseek的GRPO强化微调的关键超参数

2025-03-04 11:20:52 820

原创大模型微调知识分享 | 微调Deepseek-R1-1.5B代码案例

大模型微调分享JBPMG&ITCenter（该内容已经过敏感词和机密词过滤，欢迎大家在保密基础上进行基础技术讨论）

2025-02-17 11:45:49 2117

原创大模型微调评估指标

大模型微调结果常用指标

2024-12-23 20:26:28 1033

原创 LLaMA-Factory框架源码介绍 | 大模型监督微调

我带大家一起阅读一下LLaMA-Factory的源码，特别是大模型监督微调方面的源码，共同学习该框架提供的参数配置文件，方便我们从源码角度上对框架进行参数了解和调整，并致力于在此基础上添加自己的超参数。

2024-12-16 19:00:10 1401

原创面向LLaMA-Factory的大模型网格搜索微调工具LLaMA-Factory-Grid-Funetuning-Tool

为解决LLaMA-Factory微调参数时需要多次运行不同参数YAML文件的命令，我们提供了一个面向LLaMA-Factory的大模型网格搜索微调工具，命名为LLaMA-Factory-Grid-Funetuning-Tool。

2024-12-16 09:49:15 429

原创 AgentScope简述与源码解析 & 两个Agent调用Qwen模型的代码实例

1. 章节介绍：为学习该内容时每章节大概内容和重点记录2. 认识AgentBase：解析AgentBase源码3. 案例一：模拟单agent的cmd对话4. 案例二：模拟多代理的问题回答

2024-12-13 17:52:44 1872 2

原创大模型vllm总结与代码理解

在生成新 token 时，其需要新的"问题"（Query）来查询所有历史"信息"（Key）并获取相关的"内容"（Value）。最终的表示是多个信息源的加权组合。将需要用到的KV Cache拆分成多个Block进行存储，每个Block内有多个KV，不管Batch内每个请求的输入输出序列多长，都可以按需申请Block存储，不过申请太多多余的空间。通过LLMEngine产生对象llm_engine以执行llm中的方法，执行vllm/engine/llm_engine.py中的step()方法逐步处理请求。

2024-12-12 17:14:22 933

原创 Coevolving with the Other You: Fine-Tuning LLM...大模型强化微调顶会论文总结

Coevolving with the Other You: Fine-Tuning LLM with Sequential Cooperative Multi-Agent Reinforcement Learning大模型强化微调顶会论文总结

2024-12-10 15:09:11 654

原创 REFT: Reasoning with REinforced Fine-Tuning大模型强化微调顶会论文阅读总结&代码分析

为了解决这个问题，我们提出了一种简单而有效的方法，称为强化微调（ReFT），以提高学习法学硕士推理的泛化性，并以数学问题解决为例。ReFT首先用SFT预热模型，然后使用在线强化学习，特别是本文中的PPO算法，进一步微调模型，其中自动对给定问题的。SFT在 CoT的数据中微调，最终得到的模型，大概率是overfit 我们的训练数据的，也就是说会更偏向于我们的CoT结果。请注意，ReFT通过学习与SFT相同的训练问题来获得改进，而不依赖于额外的或增强的训练问题。2.整个过程使用PPO的方法进行训练。

2024-12-10 11:38:14 1788 3

原创最新大模型强化微调论文总结 | openai公布最新chatgpt专用模型微调成果

宣布强化微调 (RFT) 预览版，允许使用强化学习对自定义数据集上的 o1 模型进行微调（明年公开发布）RFT 的应用包括为法律、金融、医疗保健和工程等领域创建专家模型（例如，与汤森路透合作寻找法律助理）对于特定任务，o1 Mini + RFT 表现优于完整的 o1 模型，模型更小、更快、更便宜。OpenAI 仅支持强化微调的 Alpha 测试申请，并且名额有限，「非常适合正在与专家团队一起处理非常复杂任务的组织」，个人用户至少得等到明年了。

2024-12-09 11:30:03 1830

原创 cuda运行出现FileNotFoundError: [Errno 2]No such file or directory:‘ /usr/local/cuda/bin/nvcc‘问题

当运行用到cuda的github仓库时出现该问题。

2024-12-05 11:06:41 1450

原创 llamafactory大模型微调单卡转多卡出现SignalException: Process 3232810 got signal: 1错误

问题分析：nohup后台不灵光，如果非正常exit终端的话，会将Signal信号送给进程，最终导致全部中止。我是用的llamafactory微调，我的大模型微调之前使用的单卡，切换到双卡并行训练后，首先出现报错。这个问题解决后命令启动后正常运行，但一个小时内总是会出现，中断错误。是退出终端不马上关，使用exit退出;这样就算断开连接，命令也会继续运行。本人尝试第一种方法，问题解决。解决方案查看我的博客。

2024-10-31 16:23:42 933 2

原创 llamafactory单卡转多卡出现ModuleNotFoundError: No module named ‘llamafactory‘问题

添加环境变量，这个就是将当面conda环境优先级最高，但是一次性的，也就是每次重新进入环境后都要执行这个指令。别的方法应该就是删除系统里的torchrun 或去永久性修改顺序，但是我没具体的去试一下。时，只能使用系统默认的 Python 环境，导致找不到 PyTorch 和其他依赖项，torchrun 已经在全局用户目录中安装过，虽然我在conda环境下安装pytorch，但是在多卡使用。命令时还是会调用全局里的torchrn ，这个是由于 eho $PATH 中系统变量在conda环境变量的前面。

2024-10-24 17:13:49 2134 1

原创大模型微调经验关键参数总结

batch_size、accumulation_steps、warmup_ratio、learning_rate与epoch对大模型的性能影响及参数间关系

2024-10-21 17:43:43 1933

原创 A Survey of Large Language Models大模型综述论文章节总结

这篇论文出自于中国人民大学，全面回顾了大型语言模型 (LLM) 的最新进展，重点关注其发展背景、关键发现和主流技术。

2024-10-17 17:28:38 2497

原创毛概考试重点总结

一1怎么把握毛思的主要内容和活的灵魂新民主主义革命理论（内容）社会主义革命和社会主义建设理论革命军队建设和军事战略理论政策和策略的理论思想政治工作和文化工作理论党的建设理论除此之外国际战略和外交工作的理论实事求是（灵魂）群众路线独立自主2科学认识毛泽东思想的历史地位马克思主义中国化的第一个重大理论成果中国革命和建设的科学指南中国共产党和中国人民宝贵的精神财富二...

2024-10-14 11:29:33 1051 8

原创 Unfolding Local Growth Rate Estimates for (Almost) Perfect Adversarial Detection顶会论文总结

轻量级的二分类器；局部固有维度与几种简单的调整卷积神经网络(CNN)定义了许多感知任务的最先进解决方案。然而，目前的CNN方法在很大程度上仍然容易受到输入的对抗性扰动的影响，这些扰动是专门为欺骗系统而设计的，同时人眼几乎无法察觉。近年来，人们提出了各种方法来保护cnn免受此类攻击，例如通过模型强化或添加显式防御机制。因此，在网络中包含一个小的“检测器”，并在区分真实数据和包含对抗性扰动的数据的二元分类任务上进行训练。在这项工作中，我们提出了一个简单且轻量级的检测器，它利用了最近关于网络。

2024-10-14 11:10:59 1078

原创前后端基础总结

是一个 CSS 的扩展，它在 CSS 语法的基础上，允许您使用变量 (variables), 嵌套规则 (nested rules), 混合 (mixins), 导入 (inline imports) 等功能，令 CSS 更加强大与优雅。对你的代码来说是一个包管理器，你可以通过它使用全世界开发者的代码，或者分享自己的代码。Yarn 做这些快捷、安全、可靠，所以你不用担心什么。是一门 CSS 预处理语言，它扩展了 CSS 语言，增加了变量、Mixin、函数等特性，使 CSS 更易维护和扩展。

2024-10-13 17:25:23 316

原创 windows与linux常用命令对比

版权声明：本文为CSDN博主「南风孤梦晓辰星」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/JacaCao/article/details/100189445。序号 Windows命令 Linux命令命令描述。10 ctl-z Ctl-D EOF（文件结尾）27 rar -e tar -xzf 解压缩。26 rar -a tar -czf 压缩。9 ctl-c Ctl-C 休息（信号）

2024-10-13 11:41:19 466

原创 SpaceX低轨卫星轨道计划总结

V 频段的星座将利用目前卫星通信很少采用的 37 吉赫～50 吉赫范围内的频谱，与前两个阶段的 Ka/Ku 频段星座共同为用户提供通信速率更快、时延更低的宽带卫星通信服务。2017 年～2018 年，“星链”星座的所有发展计划均已得到美国联邦通信委员会的批准，获得了在美国的落地权。此外，该星座还引起了美国军方的特别关注，并于 2018 年获得美国空军战略开发规划与实验办公室价值 2870万美元的合同，用于在未来三年内测试军方使用该星座服务的可行性与方式。美国太空探索技术公司。**第二阶段：**全球组网。

2024-10-13 11:28:37 1092

原创 SpectralDefense: Detecting Adversarial Attacks on CNNs in the Fourier Domain顶会论文总结

尽管卷积神经网络(cnn)在许多计算机视觉和图像分析任务中取得了成功，但它们仍然容易受到所谓的对抗性攻击:输入图像中的微小、精心设计的扰动可能导致错误的预测。一种可能的防御方法是检测对抗性的例子。在这项工作中，我们展示了如何使用分析来区分良性测试样本和对抗图像。我们提出了两种新的检测方法:我们的第一种方法使用输入图像的来检测对抗性攻击。这种简单、鲁棒的分类器可以成功地检测到常用攻击方法的对抗性扰动。第二种方法建立在第一种方法的基础上，并在网络的。有了这个扩展，与不同的攻击方法相比，我们能够提高对抗性检测率。

2024-10-13 11:22:18 657

原创 VDVAE:Very Deep VAEs Generalize Autoregressive Models and Can Outperform Them on Images顶会论文总结

我们首次提出了一种分层VAE，它可以快速生成样本，并且在所有自然图像基准上的对数似然性 LL（log-likelihood ）能优于PixelCNN。我们首先观察到，在理论上，VAEs实际上可以代表自回归模型，如果它们存在的话，如果它们足够深的话，也可以代表更快、更好的模型。尽管如此，自回归模型在对数似然方面的历史表现优于vae。我们通过将VAE扩展到比先前探索的更大的随机深度来测试深度不足是否解释了原因，并对其进行了CIFAR-10, ImageNet和FFHQ评估。。

2024-10-13 11:19:40 772

原创 Adaptive Modeling Against Adversarial Attacks顶会论文总结

对抗性训练是用对抗性数据训练深度学习模型的过程，是深度学习模型最成功的对抗性防御方法之一。我们发现，如果在推理阶段对该模型进行微调，使其适应带有额外信息的对抗输入，则可以进一步提高对抗性训练模型对白盒攻击的鲁棒性。我们引入了一种算法，在原始输出类和“邻居”类之间使用现有的训练数据在推理阶段对模型进行“后训练”。预训练的FastFGSM CIFAR10分类器基模型对白盒投影梯度攻击(white-box projected gradient attack, PGD)的准确率从46.8%显著提高到64.5%。

2024-10-13 11:15:04 1180

原创 R语言基础常用代码总结

a[1:4] # 取出第 1 到 4 项，包含第 1 和第 4 项。(1, 3, 5)] # 取出第 1, 3, 5 项。(-1, -5)] # 去掉第 1 和第 5 项。[数据框（data.frame)](向量（vector）(3, 4) #赋值。

2024-10-13 11:09:11 1534

原创考研目标院校选择

目标院校选择

2024-10-13 11:04:26 710 2

耶鲁博弈论24讲_全笔记_v_2.1

game theory.zip

camera开发流程

CameraCaptureDemo.zip

AcitityDemo.7z

空空如也