自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 一个面向遥感语义分割与变化检测的开放词汇预标注工具

RS Prelabel Studio 的核心目标是将开放词汇遥感语义分割和语义变化检测能力整理成一个更加易用的预标注工具。模型生成初始结果,人工进行核查和修订。对于遥感语义分割、变化检测、建筑变化检测和样本预标注任务,这类流程可以在一定程度上降低人工标注成本,也有助于把科研模型更自然地接入实际工程应用。欢迎对遥感智能解译、语义变化检测、开放词汇分割或样本预标注感兴趣的朋友关注项目。如果觉得这个项目有帮助,也欢迎在 GitHub 上点一个 Star 支持一下。

2026-05-25 16:21:09 191

原创 使用GEE以及LandSat8植被指数NDVI计算

绑定完成之后输入js代码,选择研究区域,以及时间,在时间范围内筛选云量较少,有效区域范围95%以上的影像,建议不要使用镶嵌影像,因为在内蒙等区域植被生长周期不同,镶嵌尽管相差一两个月也可能导致植被的生长周期出现巨大差异,将代码复制点击Run运行。可以新建一个项目或者是使用一个创建好的项目,之后的结果会存放再对应的项目之下,第一次使用需要登录谷歌账号绑定google cloud,可以创建项目相关文件夹。选择地表反射率的L2层级产品,这个产品是做了辐射定标,大气校正,以及正射校正的产品。点击L2进入如下界面。

2026-05-12 19:48:41 54

原创 使用 Ollama 本地部署 Qwen3.5-4B 多模态模型

对于大模型初学者来说,本地部署的第一步不一定是直接追求最大、最强的模型,而是先把完整流程跑通。qwen3.5:4b这是 Qwen3.5 系列的 4B 多模态模型,支持文本和图像输入,适合用来学习本地多模态大模型部署。Ollama 可以简单理解为一个本地大模型运行器。它不是模型本身,而是负责模型下载、模型管理、本地推理和 API 服务。

2026-05-08 11:34:30 597

原创 # BPE Tokenizer:从训练规则到推理切分的完整理解

BPE 是一种子词切分方法,本质上通过合并高频相邻符号构建词表。训练阶段按频率做 merge,得到固定规则和优先级。推理阶段不会重新学习,也不会重新统计频率,只会执行已保存的 merge 规则。训练阶段的 8k、32k、50k 等限制,控制的是 tokenizer 规模;推理阶段没有面向单条输入的额外 merge 次数上限,而是一直合并到不能再合并为止。merge 规则通常保存在 tokenizer 文件中,而不是模型权重中。

2026-04-16 13:27:50 363

原创 从零理解 RAG:它不是“让大模型记住知识”,而是给大模型接上一套外部大脑

文档被解析出来之后,通常不会整篇作为一个整体去检索,而是会被切成多个小块,也就是常说的 chunk。很多初学者会以为 chunk 只是“按长度切分文本”,但真正好的 chunk 远不止如此。它本质上是在定义:知识库里,什么才算一个适合被召回的最小语义单元。如果一个 chunk 太小,语义往往不完整,用户问题明明对应某一段内容,却只能召回零散句子;如果一个 chunk 太大,虽然信息完整,但相似度检索容易失焦,召回结果里混进大量无关内容,反而增加大模型理解成本。

2026-04-16 10:27:03 473

原创 SCNP语义分割边缘logits策略

在分类或分割任务中,网络最后输出的通常不是概率,而是logits,也就是每个类别的原始分数。z2.10.3−1.2z2.10.3−1.2这表示该像素对三个类别的“偏好分数”,但它们还不是概率。piezi∑jezjpi​∑j​ezj​ezi​​这是一个非常关键的点。SCNP 里的“同类”不是根据预测结果,也不是根据argmax,而是根据真值标签来定义。训练时我们有 GT 标签。

2026-04-07 15:18:35 433 1

原创 建筑变化检测数据集综述:LEVIR-CD、WHU-CD 与 PRCV 建筑变化检测数据

在遥感变化检测任务中,是最常见、也最具代表性的一个分支。与一般地物变化检测相比,建筑变化检测更关注城市扩张、拆迁重建、灾后恢复、违建巡查等实际场景,因此在智慧城市、国土监管、灾害评估和城市规划中都有很高的应用价值。近年来,随着双时相遥感影像和深度学习方法的发展,一批公开的建筑变化检测数据集逐渐成为研究和工程验证中的重要基准,其中最常被提及的包括和。这三类数据集都面向,即输入同一区域两个时相的影像,输出“变化 / 未变化”二分类结果。但它们在上存在明显差异。

2026-03-24 14:13:31 675

原创 CVAT辅助标注工具介绍与本地部署教程

由于免费用户的使用AI工具的次数是有限的,付费用户Solo或者公司团队Team可以使用更多次数,团队协作以及接入更多HuggingFace和Robotflow上的模型,Solo付费为33美元一个月使用10000次AI工具,Team付费为66美元一个月30000次使用工具。(如SAM2等任何你认为效果更好的模型!仅为测试效果,只标住了道路,建筑,河流三种类型,可以看到全程没有人为参与和调整但是标注的细节非常出色,建筑区域没有包含多余物体,人行道的道路上也尽量不包含树木和车辆,河流的边界也没有包含植被。

2026-02-28 14:41:34 1766

原创 UAV 热红外 & RGB-T 数据集速记

HIT-UAV。

2026-01-22 16:45:35 1111

原创 Ultralytics YOLO26 正式发布:原生端到端、更好部署、更强边缘推理

Ultralytics 在 2026 年 1 月 14 日正式发布了 YOLO26(文档与模型同步上线)。它并不是“在旧版本上继续堆模块”,而是更像一次面向真实部署场景的系统性重构:从架构到训练策略,都围绕 边缘与低功耗设备的推理效率、集成复杂度、以及工程可落地性来做取舍与优化。原生端到端(Native E2E):预测结果直接输出,减少传统检测流水线的额外后处理负担更“硬件友好”的简化:移除一些会影响导出与兼容性的组件,降低部署门槛。

2026-01-14 15:42:23 1857

原创 风云四号B星FY-4B L1级别数据批量辐射定标经纬度转换裁剪生成图像脚本

FY4B 属于我国新一代静止轨道气象卫星系列(FY-4)的业务星,主要面向东亚—西太平洋地区进行高时频的全圆盘观测(Full Disk),常见下游产品就包括各通道的辐射计量化数据。和常见的“等经纬格网”(EPSG:4326)不一样,FY4B 的原始 Level-1/中间产品通常采用静止轨道标称投影(也可理解为以卫星星下点为中心的几何投影)。这意味着:文件里的像元是按“仪器扫描几何”排布的,并非规则的经纬网格;像素行列与真实经纬度之间的对应关系,必须靠几何模型或**地理查找表(GLT)**才能恢复出来。

2026-01-06 13:46:00 1353

原创 UAV-Speed:基于 YOLO 目标跟踪与相机运动补偿的单目无人机车辆测速(二)——加权滑动平均速度优化

在前期工作中,我们实现了一套基于单目无人机视频的车辆速度估计算法框架,结合目标检测、目标跟踪与单应性背景补偿,在复杂斜视场景下实现了连续的目标速度估计,并在多段真实无人机视频中完成了验证。相关代码与实验配置已开源于 GitHub:👉在进一步实验过程中发现,采用固定系数指数滑动平均(EMA)的速度平滑策略,在检测噪声、几何不稳定或目标接近图像边缘时,仍可能出现局部速度波动。

2025-12-26 13:46:13 1183 1

原创 无人机光伏板热异常检测数据集

在光伏电站的实际运行中,组件长期暴露在强光、温差、风沙、湿度和机械应力等多重环境因素下,极易出现热点、隐裂、焊点失效、遮挡导致的局部过热等一系列潜在缺陷。这些问题往往难以通过可见光影像直接识别,但会在热成像中表现为异常的温度分布,因此热红外技术逐渐成为光伏巡检与运维中最重要、最直观的一类检测手段。借助红外传感器(地面测量或无人机搭载),可以快速获取大范围组件的温度场信息,对热点位置、热异常形态和潜在电气故障进行自动化诊断。

2025-12-10 20:13:55 955

原创 UAV-Speed:基于 YOLO 目标跟踪与相机运动补偿的单目无人机车辆测速

基于 YOLOv11 + BoT-SORT + 单应性(Homography)相机运动补偿的,面向实际巡检飞行。📦 项目地址(GitHub):👉。

2025-11-29 15:11:31 1710

原创 无人机卫星遥感PV太阳能电板分割/检测数据集

该数据集是一个面向光伏板遥感分割任务的多分辨率数据集,联合了卫星、高空航空影像以及无人机正射影像三类来源,用于支持在不同空间分辨率下对光伏板的精细识别与分割研究。PV08:来自高分二号和北京二号等卫星影像,空间分辨率约0.8 m,既包含屋顶光伏,也包含地面光伏电站场景,适合研究中高分辨率卫星条件下的光伏板识别与大范围监测。PV03:来自航空摄影影像,空间分辨率约0.3 m,主要针对地面光伏场站。

2025-11-28 23:03:13 676 4

原创 AIDER面向无人机灾害场景识别的公开图像数据集

AIDER(Aerial Image Database for Emergency Response applications)是一套专门面向无人机灾害场景识别的公开图像数据集,所有图片都从空中视角拍摄,覆盖了火灾(fire)、洪涝(flooded_areas)、建筑坍塌(collapsed_building)、交通事故(traffic_incident)以及正常场景(normal)这五大类别。

2025-11-27 19:46:55 715

原创 无人机视角下的边坡滑坡检测:Hong Kong UAV Landslide/Damage 公开数据集分享与解读

在山地与道路巡检场景中,边坡滑坡往往具有突发性强、演化快、影响范围难以第一时间准确判定的特点。相比传统地面勘查或固定监测点,无人机具备机动灵活、覆盖范围大、可低空斜视获取细节等优势,能够在“日常巡检—灾害早期迹象—应急响应”全链条中提供高分辨率影像证据。尤其是斜视(oblique-view)航拍能更直观地呈现坡面裂缝、局部塌落、松散堆积体、植被扰动等与滑坡相关的关键表征,为后续的自动化识别(检测/分割)、灾害范围提取、危险等级判读提供数据基础。

2025-11-24 20:00:50 845 6

原创 为什么你的模型看不见小目标?试试 YOLO11-P2,这次真的有效!

在目标检测领域,YOLO 系列一直以“快、准、轻”著称。从最早的 YOLOv3 到 YOLOv8、YOLOv9,再到最新的 YOLO11,每一次迭代都在精度、速度与可扩展性之间寻找新的平衡。然而,随着无人机、边缘计算、移动终端等场景的兴起,我们开始面临新的挑战:如何在 极端受限的计算资源 下,依然保持稳定、精准的检测性能?这正是YOLO11-P2出现的背景。它是 YOLO11 系列中的一种轻量化结构变体,专为高分辨率小目标检测与低延迟实时推理场景优化。通过引入更浅层的P2 特征层。

2025-10-28 20:10:32 2726 7

原创 模型不是黑箱:Netron 让 YOLOv11 的每个算子“有图有真相”

当模型越训越大、导出链路越拉越长时,我们常常会卡在一个朴素却关键的问题上——我到底在跑一张怎样的网络?代码里到处是模块封装、配置继承与自动导出,权重文件(.onnx / .pt / .tflite …)能跑,但结构却像雾里看花:分支在哪里汇合?通道数是否按设计递增?下采样/上采样是否一致?这直接影响到我们解释模型、定位瓶颈与排查部署差异(如 PyTorch vs TensorRT)。基于这个需求,我决定用 Netron 把模型“摊开给自己看”。

2025-10-24 16:52:56 1107

原创 VisioFirm——深度学习集成AI工具的自动标注平台

无论您是在为YOLO、SAM还是自定义模型准备数据集,VisioFirm都能通过其直观的Web界面和强大的后端,显著优化您的工作流程。在AI模型训练的数据 pipeline 中,高质量的标注数据已成为新的“瓶颈”。其技术核心通常包含一个强大的基础模型,例如基于SAM(Segment Anything Model) 的零样本分割引擎,能够根据用户的简单点击,瞬间勾勒出任何目标的精准像素级掩码。这种“AI打底,人工精修”的人机协同模式,使其成为任何需要处理图像数据的研究者与工程师不可或缺的效率利器。

2025-10-12 19:11:33 2189

原创 LabelStudio+MobileSam/Sam辅助分割标注

面对海量的图像分割标注任务,你是否渴望能找到一种方法,将标注效率提升数倍?Meta的Segment Anything Model (SAM) 正是这样一个答案,但其庞大的模型体积有时会带来部署上的挑战。本文将提供一个实用的解决方案:我们将一步步引导您,如何在功能丰富的LabelStudio平台上,集成高效的轻量级模型MobileSAM,搭建一套“指哪打哪”的交互式智能标注流程。通过本实践,您将能快速为自己的标注项目注入AI动力,实现点击即可生成高质量掩码的流畅体验。

2025-09-28 15:17:25 1481

无人机拍摄滑坡数据集,包含滑坡区域和堆集区域分割掩膜

Roboflow平台上的“Hong Kong UAV Landslide”(香港无人机山体滑坡)数据集是一个专为计算机视觉和无人机应用领域整理的图像集合。该数据集主要包含在香港地区发生山体滑坡后,通过无人机拍摄的高分辨率航空影像。香港地形陡峭、降雨密集,是滑坡灾害易发区。此数据集中的图像经过精细标注,标识出了滑坡壁、堆积物和受影响区域等关键特征。它为研究人员和开发者提供了一个标准化的宝贵资源,用于训练和测试机器学习模型,以实现对山体滑坡的自动识别、制图和损害评估,最终目标在于提升灾害响应能力和边坡安全管理水平。

2025-11-24

武汉大学本科-硕士-博士论文 LaTeX 模板

本项目为武汉大学本科、硕士及博士学位论文的LaTeX模板。它严格遵循武汉大学最新发布的毕业论文格式规范,旨在帮助学子们从繁琐的Word格式排版中解脱,专注于论文内容本身。模板设计简洁高效,开箱即用,自动处理页眉页脚、章节结构、参考文献引用、图表编号等复杂格式要求,确保生成的论文文档符合学校的官方审核标准。使用本模板可以有效提升论文写作效率与排版质量,是武大学子撰写毕业论文的得力助手。

2025-10-25

AIDER无人机应急灾害数据集-灾害检测与快速响应模型训练资源

AIDER(Aerial Image Dataset for Emergency Response) 是面向无人机/空中影像应急场景识别的公开数据集,由塞浦路斯大学 KIOS CoE 团队(Christos Kyrkou 等)整理发布。数据涵盖火灾/烟雾、洪水、建筑倒塌/瓦砾、交通事故及正常场景等类别,适用于灾害检测、场景分类与应急响应算法研究。数据集正式托管于 Zenodo(DOI:10.5281/zenodo.3888300),附带说明文档与引用信息,便于学术复现与工程基准对比。使用时请遵循原发布条款并在成果中致谢原作者与数据来源。可以用于无人机目标检测,无人机图像分类等经典图像算法的训练数据集。

2025-10-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除