一条破秋裤-CSDN博客

原创下载哨兵2号遥感数据

七星农场位于经度：132.592492、纬度：47.294033。七星农场是黑龙江农垦总局系统国营农场，隶属建三江管理局。位于黑龙江垦区东部，福前铁路通过场区。场部距富锦市政府驻地45公里。以农场南部的七星河得名。-输入纬度，经度【注意, 小数点】Bigemap地球在线。

2025-05-22 14:33:46 265

本文介绍了Landsat数据的下载、处理和分析流程。首先，通过USGS的EarthExplorer网站下载Landsat影像，选择L1TP或L2SP数据根据需求。接着，安装ENVI软件，并对下载的Landsat影像进行头文件修改、辐射定标和大气校正。然后，使用ENVI工具裁剪图像，可以通过导入shp文件或制作ROI实现。此外，文章还详细说明了如何计算NDVI、WET和NDBSI等遥感指数，并介绍了使用ENVI自带的Spectral indices工具计算其他指数的方法。最后，指导如何将处理后的遥感图像导出为

2025-05-22 13:48:42 1052

原创使用QGIS将RGBA 7波段栅格转换为RGB 3波段

RGBA色彩空间在RGB基础上增加了Alpha通道，用于控制图像的透明度，Alpha值范围为0（完全透明）至255（完全不透明）。在QGIS中进行波段转换的步骤包括：首先加载数据并确认波段数，然后打开工具箱，选择GDAL工具中的栅格转换功能，最后进行波段重排以生成新的图像。这一过程允许用户根据需要调整图像的显示效果和透明度。

2025-05-21 15:44:53 228

原创在快速端到端训练中利用多个序列长度进行图像描述处理

我们提出了一种称为扩展机制的方法，该方法处理输入时不受序列中元素数量的限制。通过这样做，模型能够比传统的基于注意力的方法更有效地学习。为了支持这一观点，我们设计了一种新颖的架构ExpansionNet v2，该架构在MS COCO 2014图像描述挑战中取得了良好的结果，并在其类别中达到了最先进水平，在离线测试集上得分为143.7 CIDErD，在在线评估服务器上得分为140.8 CIDErD，在nocaps验证集上得分为72.9 AllCIDEr。

2025-04-16 21:17:20 686

原创没有遗漏任何细节：重新审视细粒度图像字幕的自我检索

图像描述系统无法生成细粒度的描述，因为它们训练的数据要么是嘈杂的（替代文本），要么是通用的（人类注释）。这种情况因极大似然训练的促进作用而进一步加剧，后者鼓励生成频繁出现的短语。之前的研究尝试通过使用自检索（SR）奖励对描述生成模型进行微调来解决这一限制。然而，我们发现SR微调倾向于降低描述的真实性，甚至产生虚假信息。[[个人知识内容补充#^db400e|SR]]在本研究中，我们通过改善描述系统的MLE初始化并设计SR微调过程的课程来绕过这一瓶颈。为此，我们提出了。

2025-04-15 11:07:49 1051

原创 Blip：引导语言图像预训练进行统一的视觉语言理解和生成

视觉语言预训练 (vlp) 提高了许多视觉语言任务的性能。然而，大多数现有的预训练模型仅在基于理解的任务或基于生成的任务上表现出色。此外，通过使用从网络收集的噪声图像-文本对扩展数据集，在很大程度上实现了性能改进，这是监督的次优来源。在本文中，我们提出了一种新的 vlp 框架 blip，该框架可以灵活地转移到视觉语言理解和生成任务。bilip 通过引导字幕有效地利用嘈杂的 web 数据，其中字幕器生成合成字幕，过滤器删除嘈杂的字幕。

2025-04-14 14:53:37 918

原创【torchserve】农业小模型部署

利用 PyTorch 的 TorchScript 功能，将模型转换为中间表示（IR），生成一个可序列化的。，这是 PyTorch 内置的编译器，能够将计算图转换为优化的机器代码。：转换后的模型可以在不依赖 Python 的环境中运行，适用于 C++ 等其他语言的运行时环境。：（字符串）控制编译模式，影响编译时间和运行时性能的权衡。：（字典）向后端传递的额外选项，允许用户进一步自定义编译行为。：适用于小型模型，可能增加编译时间，但减少运行时开销。：编译时间最长，但可能提供最佳的运行时性能。

2025-04-07 13:06:46 661

原创【文献25/04/01】From Show to Tell: A Survey on Deep Learning-Based Image Captioning

连接视觉与语言在生成智能中发挥着重要作用。因此，大量研究工作已投入到图像描述中，即用语法和语义上有意义的句子来描述图像。从2015年开始，这一任务通常通过由视觉编码器和语言模型组成的管道来解决，后者用于文本生成。在这几年中，这两个组件通过对物体区域、属性的利用、多模态连接的引入、全注意力方法以及类似BERT的早期融合策略发生了显著演变。然而，尽管取得了令人瞩目的成果，图像描述的研究仍未得出确凿的答案。本研究旨在提供图像描述方法的全面概述，从视觉编码和文本生成到训练策略、数据集和评估指标。

2025-04-01 11:23:14 891

原创【文献25/03/29】UPFormer：用于田间葡萄叶病害分割的U形感知轻量级Transformer

在智能农业领域，分割模型实际上是及时检测和识别植物病害的标准。然而，复杂的背景和小型病害使得对葡萄叶病的分割具有挑战性。现有模型性能提升的趋势伴随着模型大小和计算成本的代价，这阻碍了在资源受限硬件上的部署。为此，我们提出了一种针对田间葡萄叶病的定制轻量级分割架构，称为U形感知Transformer（UPFormer），该架构在性能和效率之间实现了更好的权衡。具体而言，我们利用U形层次结构获取具有优越成本效率的小型词元。

2025-03-30 16:45:47 1072

原创【文献25/03/28】一种基于深度学习的VIT植物病害自动分类方法

植物病害可能会减少每个农场上相当一部分的农业产品。本研究的主要目标是为农民提供视觉信息，使他们能够采取必要的预防措施。我们提出了一种基于视觉Transformer（ViT）的轻量级深度学习方法，用于实时自动化植物病害分类。除了ViT之外，还实施了经典的卷积神经网络（CNN）方法以及CNN与ViT的结合用于植物病害分类。这些模型已在多个数据集上进行了训练和评估。根据获得结果的比较，得出的结论是，尽管注意力模块提高了准确率，但却减缓了预测速度。将注意力模块与CNN模块结合可以弥补速度上的不足。

2025-03-28 11:06:30 1040

原创【文献25/03/27】Transfer learning for versatile plant disease recognition with limited data

深度学习在近年来通过观察植物疾病对应的图像，显著提高了对植物疾病的识别能力。为了获得良好的性能，当前的深度学习模型往往需要大规模的数据集。然而，收集数据集既昂贵又耗时。因此，有限的数据是获得所需识别准确率的主要挑战之一。尽管迁移学习被广泛讨论并验证为一种有效且高效的方法来缓解这一挑战，但大多数提出的方法集中于一个或两个特定的数据集。在本文中，我们提出了一种新颖的迁移学习策略，以在多个植物疾病数据集上实现高性能的通用植物疾病识别。我们的迁移学习策略与当前流行的方法有所不同，主要体现在以下几个方面。

2025-03-27 19:19:29 1015

原创【文献25/03/26】Hyperspectral Image Transformer Classification Networks

通过这两个模块，HiT能够增强局部空间-光谱信息的捕获能力，并减少在深层网络中可能出现的局部信息丢失。最后，经过全局平均池化层和全连接层的处理，完成类别预测。

2025-03-26 15:53:16 1078

原创【B站电磁场】Transformer

安装torch环境安装jupyter训练进度条。

2025-03-20 20:22:16 373

原创【18】文本与注意力

Seq2Seq模型能够用于很多任务，比如机器翻译，编码器对应的是源语言的文本序列，解码器对应的是目标语言的文本序列和文本归纳；也可用于文本摘要，编码器对应的是段落的文本序列解码器对应的是文本摘要。但是由于RNN的特性，对于很长的序列，RNN（包括LSTM和GRU，它们只是在设计上尽量减少遗忘的发生都不可避免地出现遗忘的状况。这个缺点可以使用引入注意力机制J（Attention Mechanism）来解决。有了自注意力机制之后，就可以使用自注意力机制执行Seq2Seq任务。

2025-03-19 13:55:48 892

原创【17-3】Twitter评论情绪分类实战

【参考文档】17-3Twitter评论情绪分类.ipynb。

2025-03-15 15:45:51 375

原创【17-1】LSTM网络

Long Short Term 网络(LSTM)是一种 RNN 特殊的类型可以学习长期依赖信息在很多问题，LSTM 都取得相当巨大的成功，并得到了广泛的使用，它是RNN事实上的标准。LSTM的窍门在于拥有一个固定权值为1的自连接，以及一个线性激活函数，因此其局部偏导为1。这样的话，误差就能在时间步中传递，而不会消失或爆炸.LSTM通过门对通过的信息进行控制：门是一种让信息选择式通过的方法。LSTM通过门可以让信息不通过完全通过、通过一部份。

2025-03-14 16:16:33 385

原创【17】RNN循环神经网络基础

RNN的主要用来处理序列数据。在传统的神经网络模型中，是从输入层到隐含层再到输出层层与层之间是全连接的，每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如，你要预测句子的下一个单词是什么，一般需要用到前面的单词，因为一个句子中前后单词并不是独立的。RNN之所以称为循环神经网路，即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中。

2025-03-14 15:18:13 354

原创【16】简单文本分类【词嵌入、文本向量化、文本分类模型】

我们将使用EmbeddingBag层对文本做词嵌入聚合这个层会对每一条评论中的文本单词做embeding词嵌入，并使用默认模式“mean”计算embeding的平均值，最后输出一个聚合结果。当我们输入一个文本序列词表到EmbedingBag层时，这个层会将序列中每一个单词作词嵌入表示，并将结果根据指定的聚和计算方法计算后作为最后的输出。我们只需将每一个批次的文本整合为一条长的文本序列，并记录其中每一条评论的偏移值。【文本分类模型，不需要创建同样长度的批次，将一个批次的文本，创建到一个序列中。

2025-03-13 17:02:34 1196

原创 Deepseek学习笔记

Deepseek蒸馏模型。

2025-03-11 14:39:19 283

原创本地部署项目记录【deepseek、QWQ】

问题：解决：【跳过问题】

2025-03-07 14:05:12 390

原创使用LiveShare时，队友的浏览器一直转圈

你需要将 Vite 服务器绑定到所有网络接口，才能让其他设备通过网络访问。你可以启动 Vite 开发服务器时加上。，可能是因为 Vite 默认只在本地机器上绑定服务器，而没有开放给外部网络访问。队友正常加入，网址也进行了分享。但是队友那边的浏览器一直在转圈加载。如下：是我前端终端运行结果。连接到你的会话中，无法访问。

2024-11-30 16:31:37 424

原创针对解决conda环境BUG的个人笔记

我的问题：1、torch.cuda.is_avaliable()在命令行里是true，但是pycharm是false2、pycharm选择pytorch所在的解释器，加载失败。3、pytorch所在的解释器加载成功，但是里边的torch包莫名消失。

2024-11-29 09:46:48 1592

原创关于使用天地图、leaflet、ENVI、Vue工具实现前端地图上覆盖上处理的农业地块图层任务

遥感处理文件夹下生成out_geotiff文件夹、前端的public下也生成out_geotiff文件夹。配置环境（其中 osgeo比较麻烦，单独给出），修改文件路径，运行脚本。运行（npm run serve），看到前端页面。配置基本信息（如：ip、port、账号、密码）。配置环境，安装必要依赖（不是conda环境）。配置读取路径（个人问题），点击运行脚本。1.api：定义接口，启动数据库服务。保存，连接（如下图：连接成功）。点击运行，创建表，提示连接成功。首先配置连接信息（如）。

2024-11-27 21:54:51 718

原创根据实验试要求，打通隧道连接服务器上的数据库，前端进行数据调用。

数据库布置在了工大实验试K80服务器上，本地属于外网无法直接访问校园内网。需要打通隧道，通过堡垒机进行服务器的访问。获取到数据库数据进行前端展示。

2024-11-22 19:49:38 410

原创针对git、gitee&VSCode连接的使用 || Live Share插件使用

打开终端，桌面鼠标右键。

2024-11-15 21:53:56 794

原创针对解决前后端BUG的个人笔记

将https://start.spring.io/或者http://start.springboot.io/替换为 https://start.aliyun.com/更改执行策略会影响系统安全性，因此推荐仅在信任的环境中使用，且尽量选择 RemoteSigned 而非 Unrestricted 策略。原文链接：https://blog.csdn.net/qq_44231797/article/details/134630733。此命令仅对当前 PowerShell 会话有效，关闭后会恢复为原有策略。

2024-11-04 11:22:41 363

17-3Twitter评论情绪分类.ipynb

17-2LSTM网络.ipynb

17-1RNN循环网络.ipynb

16-2简单文本分类.ipynb

16-1文本表示&词嵌入.ipynb

空空如也