自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(63)
  • 收藏
  • 关注

原创 下载哨兵2号遥感数据

七星农场位于经度:132.592492、纬度:47.294033。七星农场是黑龙江农垦总局系统国营农场,隶属建三江管理局。位于黑龙江垦区东部,福前铁路通过场区。场部距富锦市政府驻地45公里。以农场南部的七星河得名。-输入纬度,经度【注意, 小数点】Bigemap地球在线。

2025-05-22 14:33:46 265

原创 landsat卫星遥感影像下载、处理教程

本文介绍了Landsat数据的下载、处理和分析流程。首先,通过USGS的EarthExplorer网站下载Landsat影像,选择L1TP或L2SP数据根据需求。接着,安装ENVI软件,并对下载的Landsat影像进行头文件修改、辐射定标和大气校正。然后,使用ENVI工具裁剪图像,可以通过导入shp文件或制作ROI实现。此外,文章还详细说明了如何计算NDVI、WET和NDBSI等遥感指数,并介绍了使用ENVI自带的Spectral indices工具计算其他指数的方法。最后,指导如何将处理后的遥感图像导出为

2025-05-22 13:48:42 1052

原创 使用QGIS将RGBA 7波段栅格转换为RGB 3波段

RGBA色彩空间在RGB基础上增加了Alpha通道,用于控制图像的透明度,Alpha值范围为0(完全透明)至255(完全不透明)。在QGIS中进行波段转换的步骤包括:首先加载数据并确认波段数,然后打开工具箱,选择GDAL工具中的栅格转换功能,最后进行波段重排以生成新的图像。这一过程允许用户根据需要调整图像的显示效果和透明度。

2025-05-21 15:44:53 228

原创 在快速端到端训练中利用多个序列长度进行图像描述处理

我们提出了一种称为扩展机制的方法,该方法处理输入时不受序列中元素数量的限制。通过这样做,模型能够比传统的基于注意力的方法更有效地学习。为了支持这一观点,我们设计了一种新颖的架构ExpansionNet v2,该架构在MS COCO 2014图像描述挑战中取得了良好的结果,并在其类别中达到了最先进水平,在离线测试集上得分为143.7 CIDErD,在在线评估服务器上得分为140.8 CIDErD,在nocaps验证集上得分为72.9 AllCIDEr。

2025-04-16 21:17:20 686

原创 没有遗漏任何细节:重新审视细粒度图像字幕的自我检索

图像描述系统无法生成细粒度的描述,因为它们训练的数据要么是嘈杂的(替代文本),要么是通用的(人类注释)。这种情况因极大似然训练的促进作用而进一步加剧,后者鼓励生成频繁出现的短语。之前的研究尝试通过使用自检索(SR)奖励对描述生成模型进行微调来解决这一限制。然而,我们发现SR微调倾向于降低描述的真实性,甚至产生虚假信息。[[个人知识内容补充#^db400e|SR]]在本研究中,我们通过改善描述系统的MLE初始化并设计SR微调过程的课程来绕过这一瓶颈。为此,我们提出了。

2025-04-15 11:07:49 1051

原创 Blip:引导语言图像预训练进行统一的视觉语言理解和生成

视觉语言预训练 (vlp) 提高了许多视觉语言任务的性能。然而,大多数现有的预训练模型仅在基于理解的任务或基于生成的任务上表现出色。此外,通过使用从网络收集的噪声图像-文本对扩展数据集,在很大程度上实现了性能改进,这是监督的次优来源。在本文中,我们提出了一种新的 vlp 框架 blip,该框架可以灵活地转移到视觉语言理解和生成任务。bilip 通过引导字幕有效地利用嘈杂的 web 数据,其中字幕器生成合成字幕,过滤器删除嘈杂的字幕。

2025-04-14 14:53:37 918

原创 【torchserve】农业小模型部署

​利用 PyTorch 的 TorchScript 功能,将模型转换为中间表示(IR),生成一个可序列化的。,这是 PyTorch 内置的编译器,能够将计算图转换为优化的机器代码。:​转换后的模型可以在不依赖 Python 的环境中运行,适用于 C++ 等其他语言的运行时环境。:​(字符串)控制编译模式,影响编译时间和运行时性能的权衡。:​(字典)向后端传递的额外选项,允许用户进一步自定义编译行为。:​适用于小型模型,可能增加编译时间,但减少运行时开销。:​编译时间最长,但可能提供最佳的运行时性能。

2025-04-07 13:06:46 661

原创 【文献25/04/01】From Show to Tell: A Survey on Deep Learning-Based Image Captioning

连接视觉与语言在生成智能中发挥着重要作用。因此,大量研究工作已投入到图像描述中,即用语法和语义上有意义的句子来描述图像。从2015年开始,这一任务通常通过由视觉编码器和语言模型组成的管道来解决,后者用于文本生成。在这几年中,这两个组件通过对物体区域、属性的利用、多模态连接的引入、全注意力方法以及类似BERT的早期融合策略发生了显著演变。然而,尽管取得了令人瞩目的成果,图像描述的研究仍未得出确凿的答案。本研究旨在提供图像描述方法的全面概述,从视觉编码和文本生成到训练策略、数据集和评估指标。

2025-04-01 11:23:14 891

原创 【文献25/03/29】UPFormer:用于田间葡萄叶病害分割的U形感知轻量级Transformer

在智能农业领域,分割模型实际上是及时检测和识别植物病害的标准。然而,复杂的背景和小型病害使得对葡萄叶病的分割具有挑战性。现有模型性能提升的趋势伴随着模型大小和计算成本的代价,这阻碍了在资源受限硬件上的部署。为此,我们提出了一种针对田间葡萄叶病的定制轻量级分割架构,称为U形感知Transformer(UPFormer),该架构在性能和效率之间实现了更好的权衡。具体而言,我们利用U形层次结构获取具有优越成本效率的小型词元。

2025-03-30 16:45:47 1072

原创 【文献25/03/28】一种基于深度学习的VIT植物病害自动分类方法

植物病害可能会减少每个农场上相当一部分的农业产品。本研究的主要目标是为农民提供视觉信息,使他们能够采取必要的预防措施。我们提出了一种基于视觉Transformer(ViT)的轻量级深度学习方法,用于实时自动化植物病害分类。除了ViT之外,还实施了经典的卷积神经网络(CNN)方法以及CNN与ViT的结合用于植物病害分类。这些模型已在多个数据集上进行了训练和评估。根据获得结果的比较,得出的结论是,尽管注意力模块提高了准确率,但却减缓了预测速度。将注意力模块与CNN模块结合可以弥补速度上的不足。

2025-03-28 11:06:30 1040

原创 【文献25/03/27】Transfer learning for versatile plant disease recognition with limited data

深度学习在近年来通过观察植物疾病对应的图像,显著提高了对植物疾病的识别能力。为了获得良好的性能,当前的深度学习模型往往需要大规模的数据集。然而,收集数据集既昂贵又耗时。因此,有限的数据是获得所需识别准确率的主要挑战之一。尽管迁移学习被广泛讨论并验证为一种有效且高效的方法来缓解这一挑战,但大多数提出的方法集中于一个或两个特定的数据集。在本文中,我们提出了一种新颖的迁移学习策略,以在多个植物疾病数据集上实现高性能的通用植物疾病识别。我们的迁移学习策略与当前流行的方法有所不同,主要体现在以下几个方面。

2025-03-27 19:19:29 1015

原创 【文献25/03/26】Hyperspectral Image Transformer Classification Networks

通过这两个模块,HiT能够增强局部空间-光谱信息的捕获能力,并减少在深层网络中可能出现的局部信息丢失。最后,经过全局平均池化层和全连接层的处理,完成类别预测。

2025-03-26 15:53:16 1078

原创 【B站电磁场】Transformer

安装torch环境安装jupyter训练进度条。

2025-03-20 20:22:16 373

原创 【18】文本与注意力

Seq2Seq模型能够用于很多任务,比如机器翻译,编码器对应的是源语言的文本序列,解码器对应的是目标语言的文本序列和文本归纳;也可用于文本摘要,编码器对应的是段落的文本序列解码器对应的是文本摘要。但是由于RNN的特性,对于很长的序列,RNN(包括LSTM和GRU,它们只是在设计上尽量减少遗忘的发生都不可避免地出现遗忘的状况。这个缺点可以使用引入注意力机制J(Attention Mechanism) 来解决。有了自注意力机制之后,就可以使用自注意力机制执行Seq2Seq任务。

2025-03-19 13:55:48 892

原创 【17-3】Twitter评论情绪分类实战

【参考文档】17-3Twitter评论情绪分类.ipynb。

2025-03-15 15:45:51 375

原创 【17-1】LSTM网络

Long Short Term 网络(LSTM)是一种 RNN 特殊的类型可以学习长期依赖信息在很多问题,LSTM 都取得相当巨大的成功,并得到了广泛的使用,它是RNN事实上的标准。LSTM的窍门在于拥有一个固定权值为1的自连接,以及一个线性激活函数,因此其局部偏导为1。这样的话,误差就能在时间步中传递,而不会消失或爆炸.LSTM通过门对通过的信息进行控制:门是一种让信息选择式通过的方法。LSTM通过门可以让信息不通过完全通过、通过一部份。

2025-03-14 16:16:33 385

原创 【17】RNN循环神经网络基础

RNN的主要用来处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能无力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。RNN之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中。

2025-03-14 15:18:13 354

原创 【16】简单文本分类【词嵌入、文本向量化、文本分类模型】

我们将使用EmbeddingBag层对文本做词嵌入聚合这个层会对每一条评论中的文本单词做embeding词嵌入,并使用默认模式“mean”计算embeding的平均值,最后输出一个聚合结果。当我们输入一个文本序列词表到EmbedingBag层时,这个层会将序列中每一个单词作词嵌入表示,并将结果根据指定的聚和计算方法计算后作为最后的输出。我们只需将每一个批次的文本整合为一条长的文本序列,并记录其中每一条评论的偏移值。【文本分类模型,不需要创建同样长度的批次,将一个批次的文本,创建到一个序列中。

2025-03-13 17:02:34 1196

原创 Deepseek学习笔记

Deepseek蒸馏模型。

2025-03-11 14:39:19 283

原创 本地部署项目记录【deepseek、QWQ】

问题:解决:【跳过问题】

2025-03-07 14:05:12 390

原创 使用LiveShare时,队友的浏览器一直转圈

你需要将 Vite 服务器绑定到所有网络接口,才能让其他设备通过网络访问。你可以启动 Vite 开发服务器时加上。,可能是因为 Vite 默认只在本地机器上绑定服务器,而没有开放给外部网络访问。队友正常加入,网址也进行了分享。但是队友那边的浏览器一直在转圈加载。如下:是我前端终端运行结果。连接到你的会话中,无法访问。

2024-11-30 16:31:37 424

原创 针对解决conda环境BUG的个人笔记

我的问题:1、torch.cuda.is_avaliable()在命令行里是true,但是pycharm是false2、pycharm选择pytorch所在的解释器,加载失败。3、pytorch所在的解释器加载成功,但是里边的torch包莫名消失。

2024-11-29 09:46:48 1592

原创 关于使用天地图、leaflet、ENVI、Vue工具实现 前端地图上覆盖上处理的农业地块图层任务

遥感处理文件夹下生成out_geotiff文件夹、前端的public下也生成out_geotiff文件夹。配置环境(其中 osgeo比较麻烦,单独给出),修改文件路径,运行脚本。运行(npm run serve),看到前端页面。配置基本信息(如:ip、port、账号、密码)。配置环境,安装必要依赖(不是conda环境)。配置读取路径(个人问题),点击运行脚本。1.api:定义接口,启动数据库服务。保存,连接(如下图:连接成功)。点击运行,创建表,提示连接成功。首先配置连接信息(如)。

2024-11-27 21:54:51 718

原创 根据实验试要求,打通隧道连接服务器上的数据库,前端进行数据调用。

数据库布置在了工大实验试K80服务器上,本地属于外网无法直接访问校园内网。需要打通隧道,通过堡垒机进行服务器的访问。获取到数据库数据进行前端展示。

2024-11-22 19:49:38 410

原创 针对git、gitee&VSCode连接的使用 || Live Share插件使用

打开终端,桌面鼠标右键。

2024-11-15 21:53:56 794

原创 针对解决前后端BUG的个人笔记

将https://start.spring.io/或者http://start.springboot.io/替换为 https://start.aliyun.com/更改执行策略会影响系统安全性,因此推荐仅在信任的环境中使用,且尽量选择 RemoteSigned 而非 Unrestricted 策略。原文链接:https://blog.csdn.net/qq_44231797/article/details/134630733。此命令仅对当前 PowerShell 会话有效,关闭后会恢复为原有策略。

2024-11-04 11:22:41 363

原创 针对实验试服务器的使用问题【安装anaconda+Vscode连接+jupyther远程连接】

打开Xshell软件,创建新的连接。根据①输入连接IP、端口。根据②输入连接的用户名、密码。然后点击“连接”。进入如下界面。

2024-09-04 08:37:29 474

原创 01- 收入数据集【Pytorch入门实战】

输入数据处理创建一个合适模型训练预测、评价--->机器学习:抽象出一条直线,来拟合现有的数据。【映射函数,输入映射输出】

2024-07-14 16:13:44 953

原创 Xshll连接服务器【过程记录】

开学老师提供了一款服务器,可以网页端打开,但是不可进行上传文件、复制黏贴指令。希望连接Xshll进行更有效的学习活动!

2024-07-05 15:14:30 571 1

原创 关于Wav2Lip配置&实现

Wav2Lip是一种先进的深度学习模型,旨在将音频波形直接转换为面部动画,尤其关注于唇部动作的生成与同步。这一技术的核心在于其能够利用输入的语音信号,生成与之高度匹配的嘴唇动作,从而实现逼真的语音驱动数字人物动画效果。Wav2Lip的开发不仅标志着在语音驱动的面部动画领域的一个重要进展,也为虚拟现实、游戏制作、智能语音助手等多个应用领域提供了新的技术手段。Wav2Lip模型基于生成对抗网络(GAN)设计,包含生成器和判别器两个主要部分。

2024-07-04 15:15:24 2912 3

原创 torch.cuda.is_avaliable()在命令行里是true,pycharm是false【省流:换Pycharm版本】

torch.cuda.is_avaliable()在命令行里是true,但是pycharm是false。换成了2021版,加载解释器便顺利了,torch.cuda.is_avaliable()结果True。3、pytorch所在的解释器加载成功,但是里边的torch包莫名消失。在调试了很多torch版本、python版本、cuda版本后,无计可施,开始用的2024版,命令行里是true,但是pycharm是false。2、pycharm选择pytorch所在的解释器,加载失败。

2024-04-25 18:25:49 781 1

原创 单片机05__串口USART通信__按键控制向上位机传输字符串

计算机与外界进行信息交换的过程称之为通信。在通信的过程中,通信双方都需要遵守的规则称之为通信协议。硬件协议:将数据以什么样的方式传输过去软件协议:将数据以什么样的顺序传输过去。

2024-02-25 19:06:02 2224

原创 单片机04__基本定时器__毫秒微秒延时

STM32F40X芯片一共包含14个定时器,这14个定时器分为3大类:通用定时器10个TIM9-TIM1和TIM2-TIM5具有基本定时器功能,还具有输入捕获,输出比较功能高级定时器2个。

2024-02-23 00:16:56 1763 2

原创 单片机_no target connected问题解决方法

④若以上为能解决问题,然后按住复位键,点击下图图标,然后快速松开复位键。此问题是在烧录呼吸灯程序时产生,可能因定时器配置错误导致。②长按复位键,执行以下步骤。③断开MCU电源,然后重新烧录程序即可。⑤按下图步骤恢复窗口设置,即可烧录程序。①确定通电后指示灯正常点亮。“SW-DP”(如下图)

2024-02-22 11:44:00 2243

原创 单片机03--按键--寄存器版

③设静态变量flag作为标志位,防止已有按键按下时,其他按键按下仍能进行操作。KEY1不导通时,PA0输入为低电平,KEY1导通时,PA0输入为高电平。//PB4低电平点亮。//PB5低电平点亮。获取PA0口的状态需要(GPIOA->IDR & 1<<0)。KEY1---PA0--->输入---->浮空输入/下拉输入。②if两次读取GIPA->IDR的第0位,实现消抖。②设置GPIO端口模式---->输入模式。

2024-02-21 23:07:37 742

原创 单片机02_寄存器_GPIO设置__点灯

如果想输出高电平,则需要配置为具有上拉功能的开漏输出(芯片内部的上拉电阻属于弱上拉,如果需要或者较强的驱动能力,则需要外接一个上拉电阻(硬件工程师设置))。寄存器作用:对AHB1系统总线上的片内外设模块进行时钟使能,在对应的位上写‘1’,则使能相对应的外设模块时钟。复用功能指的是GPIO端口的第二功能(除了默认的输入输出功能以外),也就是片内外设(芯片以内内核以外)模块功能管脚的专用功能。2.找出中文参考手册第六章系统总线对应的时钟使能寄存器,并且在相应的位上写‘1’使能外设模块时钟。

2024-02-20 20:09:14 1512

原创 单片机01天_stm32f407zg_创建新工程

④内核接口组:点击“ADD File”按钮,把存放在“Cortex系列内核接口驱动文件CMSIS”的文件夹下的“startup_stm32f40_41xxx.s(启动文件)”和“system_stm32f4xx.c(系统时钟文件)”添加到“内核接口组”中。①把固件库中“Libraries”文件夹下的“CMSIS”文件夹中的“Include”(Cortex系列内核接口驱动文件对应的头文件)文件夹复制到工程,存放到CMSIS文件夹下。“USER”文件夹内包含“Inc”&&“Src”。

2024-02-19 20:02:15 1149

原创 单片机01天---stm32基本信息了解

①工作电压:1.8V – 3.6V,VSS/GND(电源负极0)、VDD/VCC/V3.3(电源正极1),VREF(参考电压):内部高速时钟/内部低速时钟),但是精度不是很高,在需要测量比较精准的场合中,需要外加一个。晶振的大小范围:4 – 26 M(常用的大小为8M或25M).,搜索芯片型号,下载“数据手册”使用。:处于低电平,持续20μs(微秒)以STM32F407ZG为例。一般位于下图后面的位置。②STM32:芯片内部。(外部震荡电路),也叫。

2024-02-19 19:38:26 694

原创 C语言笔记简单版——【第12天】

xx.c(编译预处理) -> xx.i(编译) -> xx.s(汇编) -> xx.o(链接) -> xx.out。如果没有break,以后的case不再判断,直接执行后面的程序语句,直到遇到break停止or整个执行完毕。有结构体构成,所包含的结构体个数有任意个,但链表在内存中是不连续的(区别于结构体数组,真正释放空间)。过程:根据1且按照2的规则,判断满足就执行循环语句,循环体执行完后,根据3对循环变量进行操作。struct student ----stu ---- 结构体类型名。

2024-01-30 16:45:10 489

原创 【链表】————第九天

LinkList 为 LNode 类型的指针包含#include malloc函数:动态申请的空间,函数返回值均为void *类型,函数返回值: 成功:返回开辟好的空间首地址。失败:返回NULLfree函数:free函数释放,然后释放后得空间记得指向为空,否则会出现野指针。*/

2024-01-24 19:32:08 372

17-3Twitter评论情绪分类.ipynb

RNN、LSTM

2025-03-15

17-2LSTM网络.ipynb

LSTMCell实战文本分类

2025-03-14

17-1RNN循环网络.ipynb

RNNCell、数据读取、批次处理、序列上展开、初始化hiddenstate、文本分类

2025-03-14

16-2简单文本分类.ipynb

针对IMDB数据集进行简单文本分类。实战练习分词、创建词表、文本处理、批次处理、模型定义、模型训练。

2025-03-13

16-1文本表示&词嵌入.ipynb

实战练习分词、创建词表、文本处理

2025-03-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除