自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(115)
  • 资源 (1)
  • 收藏
  • 关注

原创 医疗图像中的图像语义理解

医疗图像中的图像语义理解是指这一领域结合了医学、计算机科学和图像处理技术,旨在辅助医生进行诊断、治疗规划及疾病监测。。图像语义理解在医疗领域的应用前景广阔,但也面临着技术、法规和伦理方面的挑战。随着技术的不断进步和数据的积累,这一领域有望在未来取得更多突破,为医疗保健提供更强大的工具和解决方案。

2024-06-18 15:00:00 88

原创 时序动作定位 | 提取视觉语言预训练与弱监督时间动作定位协同(CVPR 2023)

弱监督时态动作定位(WTAL)学习仅使用类别标签来检测和分类动作实例。大多数方法广泛采用现成的基于分类的预训练(CBP)来生成用于动作定位的视频特征。由于分类和局部化的优化目标不同,使得局部化结果存在严重的不完全性问题。为了在没有额外注释的情况下解决这一问题,本文考虑从视觉语言预训练(VLP)中提取自由动作知识,因为惊讶地发现普通VLP的定位结果存在过完整问题,而这只是对CBP结果的补充。为了融合这种互补性,提出了一个新的蒸馏协作框架,其中两个分支分别作为CBP和VLP。

2024-06-17 11:51:43 190

原创 医疗图像的校准

医疗图像的校准是确保图像在不同设备和场景下像素值与实际物理量之间映射的重要过程。它提高了医学影像的一致性和可比性,增强了临床应用的可靠性和精度。校准方法包括计算校准因子,以调整图像的灰度级别,从而确保其与标准参考物的物理密度值一致。具体实现中,使用了Python的OpenCV库结合NumPy计算和应用了校准因子,以确保医疗图像的准确性和标准化处理。示例代码演示了如何使用Keras和TensorFlow实现U-Net模型进行医疗图像的自动轮廓勾画,展示了技术在医疗图像处理中的应用和实现。

2024-06-17 10:16:52 165

原创 医学图像算法中的 器官识别与提取

医疗图像中的器官识别与提取是医学影像分析的重要任务,涉及多个步骤和方法。首先对图像进行预处理,如去噪、归一化和增强。接着进行器官分割,采用传统方法(如阈值分割、区域生长和分水岭算法)和现代机器学习方法(如K-means聚类和随机森林)。深度学习方法(如CNN、U-Net和Mask R-CNN)在这一领域表现尤为出色。分割后提取形态学、纹理和统计特征。最终,通过机器学习和深度学习方法(如SVM、神经网络和迁移学习)进行器官识别与分类。验证与评估步骤包括准确率、召回率和F1分数等指标。

2024-06-16 10:37:57 62

原创 医疗图像自动轮廓勾画

(也称为自动分割)是一个重要的任务,旨在从医学影像数据中自动提取出感兴趣的解剖结构或病变区域。这项技术在医学诊断、治疗规划和随访中起着至关重要的作用。以下是对这项技术的概述以及常用方法和挑战。

2024-06-14 16:05:57 138

原创 时序动作定位 | PivoTAL:弱监督时间动作定位的先验驱动监督(CVPR 2023)

引入先验信息以提升模型性能的方法。文章提出了可学习的高斯先验,通过学习高斯分布的参数(如均值和方差),来建模和利用视频中动作片段的时间分布特性。高斯先验的定义源自对标注数据的统计分析、模型训练过程和领域知识,并通过概率建模、损失函数和特征增强等方式融合到模型中。实验结果显示,高斯先验在动作定位、边界调整和错误纠正方面显著提升了模型性能。通过具体示例,文章详述了高斯先验的引入和应用步骤,包括数据统计、初始参数设定、模型训练等。总之,引入可学习的高斯先验为解决WSTAL任务提供了一种有效方案。

2024-06-01 11:46:40 86

原创 torch.cuda.is_available()显示false解决方法

确保环境变量CUDA_HOME和LD_LIBRARY_PATH正确设置。如果以上方法都没有解决问题,可以尝试重新安装PyTorch,并确保选择支持CUDA的版本。确保你已经正确安装了CUDA和cuDNN,并且它们的版本与PyTorch兼容。确保你安装的PyTorch版本支持CUDA。确保你的显卡驱动是最新的。你可以从NVIDIA官网下载最新的驱动程序并安装。确保你的GPU没有被其他进程占用。确保输出显示了正确的CUDA版本。

2024-05-17 09:03:13 2730

原创 AIGC相关的编程题目【初级题目】3. 简单的聊天机器人

3. 简单的聊天机器人:利用开源的聊天机器人框架(例如Rasa或Dialogflow),创建一个能够回答预设问题的简单聊天机器人。例如,用户可以询问天气、时间或简单的数学问题,机器人应该能够理解并回答。

2024-05-07 08:00:00 296

原创 AIGC相关的编程题目【初级题目】1. 文本生成器 2. 图像标签生成

AIGC相关的编程题目【初级题目】1. 文本生成器:编写一个程序,使用预先训练的语言模型(如GPT-2或GPT-3)来生成文本。用户输入一个单词或短语作为提示,程序输出一段继续该提示的文本。2. 图像标签生成:使用一个预训练的图像识别模型(如Inception或ResNet),编写一个程序,能够接收用户上传的图片,并返回图片中可能包含的对象的标签列表。

2024-05-06 11:01:45 475

原创 多模态路径:利用其他模态的无关数据改进变压器(CVPR 2024)

这篇论文提出了一个创新的方法,旨在通过利用与目标模态不相关的其他模态数据来改进特定模态的Transformer模型。这种方法命名为“多模态路径”(Multimodal Pathway),它允许模型通过从其他模态学习到的知识来增强其性能,即使这些数据与目标任务直接无关。

2024-05-06 10:34:35 911 2

原创 神经辐射场重建自快照压缩图像:单次曝光下的三维场景重建,无需生成模型(CVPR 2024)

本研究所采用的单曝光压缩成像系统得益于创新的光学硬件及成像算法设计,能够在单次测量过程中采集并压缩高维数据(如视频、高光谱图像等),通过二维传感器(例如CCD/CMOS相机)高效捕捉视觉信息。我们的方法能够在一次测量中捕获动态场景,把来自不同视角的图像信息集中压缩至一张单一图像内。图2:单曝光压缩成像 (SCI) 系统使用 2D 传感器在测量中捕获高维数据。

2024-05-04 10:09:02 1145

原创 革新突破:MIT与加州理工联手推出KAN,一举超越传统MLP模型!

在今天的深度学习领域,多层感知机(MLP)长久以来被视作构建神经网络的基石。然而,尽管其在多个领域内取得了巨大成功,MLP在参数效率、准确性和可解释性方面的局限性始终是科研人员试图克服的难题。今天,我们迎来了一场可能彻底改变深度学习面貌的技术革命——由麻省理工学院和加州理工学院联合领衔的研究团队提出了一种名为Kolmogorov-Arnold Networks(KANs)的全新网络结构,它不仅在理论上弥补了MLP的不足,更在实际应用中展现出惊人的性能。

2024-05-03 17:24:47 3740

原创 时序动作定位 | 基于判别增强的弱监督时序动作定位融合检测网络

弱监督时序动作定位旨在仅使用视频级动作标签识别和定位未修剪视频中的动作实例。由于缺乏帧级注释信息,正确区分视频中的前景和背景片段对于动作的时间定位至关重要。然而,除了前景和背景片段外,视频中还存在大量语义相似的片段。这些片段与前景或背景共享相同的语义信息,导致操作实例的边界定位不那么细粒度。受多模态学习成功的启发,我们从多模态输入中提取高质量的语义特征,并构建对比度损失来增强模型区分语义相似片段的能力。本文提出了一种带有判别增强的融合检测网络具体而言,设计了一个融合检测模型。

2024-05-03 15:58:33 188

原创 先进控制技术-主观题

第一大题(共4题,满分40分)1.主观题 (10分)请分别解释什么是系统分析和什么是系统综合。①系统分析——亦称“系统方法”。以系统的整体最优为目标,对系统的各个方面进行定性和定量分析。它是一个有目的、有步骤的探索和分析过程,为决策者提供直接判断和决定最优系统方案所需的信息和资料,从而成为系统工程的一个重要程序和核心组成部分。其应用范围很广,一般用于重大而复杂问题的分析,如政策与战略性问题的分析、选择,新技术的开发、设计,企业系统的输入、处理和输出的分析等。分析也可以说是对系统某种特性的分.

2024-04-26 10:18:44 774

原创 医学影像加速的技术和方法,未来医学中的高效图像技术革新

医学影像加速技术通过先进的算法和技术减少成像时间,保持或提升图像质量。MRI和CT是临床诊断重要工具。并行成像技术通过多个接收线圈收集信号减少相位编码步骤,加速成像。SENSE、SMASH、GRAPPA、mSENSE等技术通过不同方式优化数据采集和重建过程。压缩感知技术利用图像数据的稀疏性,在非均匀随机采样基础上重建图像,减少采样点数目,无明显降低图像质量。这些技术对于不能长时间保持静止的患者尤其有益,但也需考虑线圈设计、放置要求及可能增加的噪声等局限性。

2024-04-25 14:59:56 69

原创 时序动作定位 | 弱监督时间动作定位与动作引导的假阳性抑制

本文提出了一种基于 actionness 引导的假阳性抑制框架,用于解决弱监督时间动作定位任务。主要包括:1) 自我训练的 actionness 分支,学习与类别无关的 actionness,减少场景信息干扰;2) 假阳性抑制模块,通过监督学习区分真实动作和误检,在测试时过滤抑制;3) 前景增强模块,利用 actionness 指导模型学习前景特征,提高定位准确性。该方法有效抑制了由于类别相关场景导致的大量假阳性。

2024-04-25 14:59:27 176

原创 现代机器学习(ML)技术在医疗成像领域的新应用

现代机器学习技术在个性化医疗中的应用正飞速发展,尤其是在医疗成像领域。通过分析患者的医学影像数据,深度学习模型能够为每位患者提供定制化的疾病风险评估和治疗方案。这些模型能够识别疾病的早期迹象,预测治疗效果,从而辅助医生制定个性化的治疗计划。此外,结合遗传信息,机器学习技术还能够提供更精确的医疗建议。然而,实现这一目标还需解决数据隐私、模型解释性和泛化能力等挑战,并通过临床试验验证其临床价值和安全性。

2024-04-23 11:52:30 398

原创 医学影像增强:空间域方法与频域方法等

这篇博客全面综述了医学影像图像增强技术,尤其是空间域和频域方法。文章首先解释了医学影像的重要性以及图像增强在提高诊断准确性中的作用。接着,深入探讨了空间域方法,包括直方图均衡化、对比度限制自适应直方图均衡化(CLAHE)等技术,以及它们如何改善图像质量,突出重要细节。此外,也分析了频域方法,例如傅里叶变换和小波变换等,在去噪和边缘增强方面的应用。文章评估了这些技术在不同情况下的效果,并讨论了它们在实际临床应用中的潜力和挑战。最后,提出了未来研究方向,强调了结合多种技术和人工智能算法的重要性。

2024-04-22 20:36:20 434

原创 医学影像图像去噪:滤波器方法、频域方法、小波变换、非局部均值去噪、深度学习与稀疏表示和字典学习

本文全面探讨了医学影像图像去噪技术,重点讨论了多种去噪方法。首先介绍了滤波器方法,如中值滤波和双边滤波,这些方法易于实现但可能会模糊图像细节。接着,文章分析了频域方法,包括傅里叶和小波变换,这些技术能在保留边缘信息的同时去除噪声。非局部均值去噪作为一种更先进的空间域方法,通过利用图像内的冗余信息来保留结构。深度学习方法,尤其是基于卷积神经网络的技术,近年来在图像去噪领域取得了显著进展,因其强大的特征学习能力而备受关注。最后,文章讨论了稀疏表示和字典学习在去噪中的应用。

2024-04-22 19:47:55 743 2

原创 (金融会计领域)计算累计超额收益率 (CAR)

本文详细介绍了如何计算每股正常收益率和累计超额收益率。首先,通过市场模型计算股票的系统风险,即股票的β系数。然后,利用资本资产定价模型(CAPM)计算正常收益率。接着,通过计算超额收益率和平均日超额收益率,以及累计超额收益率来衡量市场的反应。最后,文章提供了相关的Python代码实现,包括计算β系数、正常收益率、超额收益率和累计超额收益率等步骤。这些计算方法和代码示例为投资者提供了一种量化评估股票投资效果的工具。

2024-04-15 18:03:41 1853

原创 (金融会计领域)普通最小二乘法回归得到的β值构建KV指数

本文介绍了如何使用KV指数衡量公司的信息披露质量。KV指数是通过股票收益率对交易量的回归系数来衡量信息披露质量的反向指标,即指数越大,信息披露质量越低。文章还提供了计算KV指数的具体公式和方法,并用Python编程实现了该计算过程,包括数据准备、回归分析和结果可视化等步骤。结果表明,KV指数与公司信息披露质量成负相关,可以作为评估公司信息披露质量的有效工具。

2024-04-15 16:27:46 697

原创 AI书籍推荐 | “塑造明天:在‘生活 3.0’中利用人工智能引领我们的未来”

——Max Tegmark来了,带着他的AI未来全景图。这不是科幻电影,这是Tegmark教授用他那MIT出身的大脑,为我们描绘的未来图景。书里不仅讨论了人工智能会如何参与犯罪、战争、审判,还聊到了它将如何影响就业、社会,乃至我们对“我是谁”这个问题的答案。将会怎样”的问题,比如:如果机器人夺走了我们的工作,我们该如何是好?还有,最重要的,我们真的准备好与机器人共处一个地球吗。不过,别忘了,未来还在你手中,Max教授只是帮你打开了一扇门而已。如果你对人工智能充满好奇,又或者对未来充满恐惧,《

2024-02-28 07:00:00 747

原创 探索视网膜:从时域到谱域光学相干断层扫描(OCT)的演进与应用

从时域到谱域光学相干断层扫描(OCT)的演进与应用

2024-02-27 11:18:18 301

原创 AI书籍推荐 | “释放创新:如何利用人工智能转变您的业务 - 领导者的终极指南”

作者实用的手法通过真实的AI案例和研究,不仅提供信息,还激发了在各种商业功能中创新应用AI的灵感。此外,书中介绍了“AI成功的三大支柱”,一个系统的框架,旨在评估和测试AI举措带来的实际价值,确保投资不仅是创新的,而且也是有影响的。不过,让AI融入商业流程,对很多大佬来说,就像走进了一座迷宫,得分析现有系统、找到适合AI下手的地方,还得让整个团队做好数字化转型的准备。无论你是正在启动组织的AI旅程,还是在管理正在进行的AI项目,或者只是寻找利用AI和机器学习解决独特商业挑战的灵感,《

2024-02-27 07:00:00 750

原创 AI书籍推荐 | 使用 ChatGPT MILLIONAIRE 指南走向财务自由

这本书就是你的黄金钥匙,打开新市场的大门,等待着你的技能,轻松开发,随手掌握。这本书的魔力在于它的实用性,充满了ChatGPT的具体示例,清晰地展示了实际应用。更新至GPT-4,这本书不仅仅适应现在的市场,简直就是未来收入的指南针!而且,这本指南不只是教你如何做,还送上一系列的加油包:超过150个“行为”提示、全面的提示卡片,让你从书本到实战,都能游刃有余。》从Chat GPT精通系列来袭,这不仅仅是一本书,这是把握未来的秘籍,有了它,ChatGPT将成为你的贴心小助手。别让机会溜走,抓住现在,让《

2024-02-26 07:00:00 392

原创 医学试纸条图像处理技术

医学试纸条图像处理是一个重要的领域,它涉及到从医学试纸条上提取和分析信息的各种技术。

2024-02-25 14:36:24 777

原创 被动收入 | Audible 联盟营销计划:如何每月赚取 5000 美元?

你是否正在寻求被动收入的方式,或者在你的网站或平台上寻求赚钱的方式?亚马逊的Audible Depot联盟营销计划是一个不错的选择。作为会员,可以向听众推广有声读物,并从中获得收益。每月有可能赚取高达5000美元的收入,现在正是加入这个计划的最佳时机。

2024-02-25 11:04:41 1378 2

原创 光学相干断层扫描(OCT)在 妇科诊断 中的革命性应用

尽管OCT在妇科的应用提供了许多潜在的优势,但它仍然是一个相对新的技术,并不是所有医疗机构都有能力提供这种类型的成像服务。随着技术的发展和医生对OCT的熟悉程度的提高,预计OCT将在妇科和其他医学领域中扮演越来越重要的角色。早期发现和准确的分类是提高治疗成功率的关键。虽然这是一个相对较新的应用领域,但OCT的非侵入性和高分辨率成像能力可能提供有价值的信息,以提高辅助生殖技术的成功率。:光学相干断层扫描(OCT)在阴道和外阴组织的评估中的应用正在逐渐展开,提供了一种新的方法来诊断和监测各种妇科疾病。

2024-02-23 20:30:01 1066

原创 胶囊内镜技术的革命与挑战

当胶囊内镜被吞咽并开始通过消化道时,它的相机不断拍摄图片,同时LED灯提供必要的照明。:虽然胶囊内镜能够提供清晰的消化道图像,但其解析度相比传统内镜可能较低,这可能会影响对病变的识别和评估。此外,由于胶囊的移动性,可能会出现模糊的图像,这会影响诊断的准确性。在智能医疗领域,这些问题的解决需要更先进的技术创新、数据处理能力的提升、成本降低策略以及更精确的定位和诊断工具的开发。:胶囊内镜的成本相对较高,这可能限制其在低收入地区或资源有限的医疗体系中的可用性和普及。

2024-02-23 19:28:07 346

原创 色散补偿 在智能医疗领域的应用

色散补偿主要用于光学和电信领域,特别是在光纤通信中,用来纠正或减少由于色散效应引起的信号失真。色散是指不同频率(或波长)的光波在介质中传播速度不同的现象。在光纤通信系统中,色散会导致光脉冲随着传播逐渐展宽,从而降低信号的传输质量和通信系统的性能。色散补偿的目的是通过一系列技术和材料来平衡或逆转色散效应,以保持信号的完整性和传输效率。色散补偿技术的选择和设计取决于多种因素,包括通信系统的类型、传输距离、信号的波长和带宽等。正确的色散补偿对于提高光纤通信系统的性能和可靠性至关重要。

2024-02-20 14:22:18 365

原创 网络爬虫实战 | 上传以及下载处理后的文件

这段代码的目的是将本地存储的图像发送到一个服务器端点,以便进行处理,并将处理后的图像以Base64编码的形式接收回来。整个流程分为以下几个步骤:初始化和配置: 导入必要的库,配置服务器URL,禁用SSL证书警告,定义本地图像路径和服务器的处理端点。读取和编码图像: 以二进制模式打开本地图像文件,读取内容,并将其编码为Base64字符串,以便可以通过JSON进行网络传输。发送请求: 使用requests库创建一个会话,并通过POST请求将编码的图像数据发送到服务器的处理端点。在请求中忽略SSL证

2024-02-15 20:02:45 1363 1

原创 C++ Qt框架开发 | 基于Qt框架开发实时成绩显示排序系统(3) 保存表格数据

​对上两篇篇的工作C++ Qt框架开发| 基于Qt框架开发实时成绩显示排序系统(1)-CSDN博客和C++ Qt框架开发 | 基于Qt框架开发实时成绩显示排序系统(2)折线图显示-CSDN博客继续优化,增加一个保存按钮,用于保存成绩数据。

2024-02-13 18:15:54 968

原创 C++ Qt框架开发 | 基于Qt框架开发实时成绩显示排序系统(2)折线图显示

基于Qt框架开发实时成绩显示排序系统 折线图显示

2024-02-11 20:48:57 880

原创 C++ Qt框架开发 | 基于Qt框架开发实时成绩显示排序系统(1)

本程序是一个基于Qt框架开发的用户友好型软件工具,专为管理和展示运动员成绩信息而设计。 该程序的亮点在于其直观的数据展示方式。新输入或更新的运动员数据会以红色高亮显示,使用户能够清晰地追踪每次操作后数据的变化。 通过精心设计的GUI,该工具提供了清晰、易于导航的用户界面,包括用于数据展示的表格视图、用于输入和编辑运动员信息的表单,以及一系列操作按钮,如排序、添加新运动员、编辑选定运动员和删除运动员等。整个应用旨在为教练、体育分析师或团队管理者等用户提供一个高效、直观的运动员管理和分析平台。

2024-02-11 18:38:14 618

原创 时序动作定位 | 弱监督时间动作定位的等效分类映射

Equivalent Classification Mapping for Weakly Supervised Temporal Action Localization 弱监督时间动作定位的等效分类映射该论文介绍了用于弱监督时间动作定位的等效分类映射(ECM)方法。 它将预分类和后分类两种分类流程结合到一个统一的框架中。 该方法强调等价机制,确保两个管道之间的分类分数和聚合权重一致。 它还提出了一个权重转换模块和等效的训练策略来提高性能。 ECM 在基准数据集上的动作定位方面显示出有希望的结果,而无需详细的

2024-02-04 17:03:20 73

原创 基于敏锐背景响应和自蒸馏学习的弱监督时序动作定位 SODA: WTAL Based on Astute Background Response and Self-Distillation Learni

SODA: Weakly Supervised Temporal Action Localization Based on Astute Background Response and Self-Distillation Learning”提出了一种创新方法来解决弱监督时间动作定位中过度定位、联合定位和欠定位的挑战。和。这些策略旨在分别有效抑制背景响应并增强模型发现完整动作框架的能力。

2024-02-03 21:00:48 64

原创 时序动作定位 | 背景点击监督的时序动作定位

该论文介绍了 BackTAL,这是一种利用背景点击监督进行弱监督时序动作定位的新方法。 它将焦点从动作帧转移到背景帧,通过强调背景错误来改进定位。 BackTAL 包含分数分离模块和亲和力模块,增强了位置和特征建模。

2024-02-03 19:39:31 79

原创 超声成像(Ultrasound Imaging)技术的不同应用

超声成像技术利用声波探测和成像身体内部结构,包括三种主要的扫描方式:A-scan、B-scan和C-scan。A-scan(振幅扫描)主要用于测量材料厚度或检测内部缺陷,如裂纹或空洞,广泛应用于医疗诊断和工业无损检测。B-scan(亮度扫描)提供二维横切面图像,特别适用于产科和眼科,用于观察胎儿发育或眼睛结构。C-scan(平面扫描)提供物体的平面视图,用于映射材料内部的缺陷分布,如腐蚀、裂缝或层裂,适用于检测大型结构如航空航天部件和复合材料的完整性。这三种扫描技术各有其特点和应用,展现了超声波在不同领域的

2024-02-03 19:09:09 552

原创 新型内窥镜成像技术研究

变焦光学、光学相干层析成像(OCT)和荧光共聚焦成像是先进的成像技术,广泛应用于科研和医疗领域。变焦光学通过调整镜头组件实现不同焦距,提供灵活的视野和放大能力,适用于摄影和望远镜。OCT利用近红外光和低相干干涉原理,提供样本的高分辨率三维图像,尤其在眼科和皮肤科领域具有重要价值。荧光共聚焦成像结合荧光和共聚焦技术,通过空间滤波器提高图像分辨率,适用于细胞和分子层面的研究,能够进行三维重建和多通道成像。尽管具有高分辨率和非侵入性等优点,这些技术也有各自的局限。

2024-02-02 14:12:56 943

原创 OpenCV学习笔记(Python)—— 批量提取图像轮廓并保存结果到保持原始结构的输出目录

批量处理图像,对每个图像提取轮廓内的区域并将轮廓外的区域设置为白色背景,然后保存处理后的图像到指定的输出目录,同时保持与输入目录相同的文件和目录结构。

2024-01-30 11:41:42 875

使用Matlab2018a实现目标定位视频教学

视频教学内容为使用自己的数据集,目标是通过使用MATLAB R2018a中的trainingImageLabeler工具对照片进行标注,然后整理训练图像,并采用Faster-RCNN框架生成和测试一个网络模型。首先,使用trainingImageLabeler工具对照片进行标注,并保存标注结果为.mat格式的文件。然后,将图像大小更改为227×227,并按顺序保存。接下来,使用一个函数来提取图像中的人物,并将其调整为指定的大小。然后,设置网络参数并生成网络模型,其中使用了sgdm优化器和alexnet预训练模型。最后,使用训练好的模型对一张测试图像进行目标检测,并将检测结果可视化展示出来。该项目的主要步骤包括照片标注、图像整理、网络生成与测试。

2023-09-30

使用Matlab2018a实现目标定位

该项目使用自己的数据集,目标是通过使用MATLAB R2018a中的trainingImageLabeler工具对照片进行标注,然后整理训练图像,并采用Faster-RCNN框架生成和测试一个网络模型。首先,使用trainingImageLabeler工具对照片进行标注,并保存标注结果为.mat格式的文件。然后,将图像大小更改为227×227,并按顺序保存。接下来,使用一个函数来提取图像中的人物,并将其调整为指定的大小。然后,设置网络参数并生成网络模型,其中使用了sgdm优化器和alexnet预训练模型。最后,使用训练好的模型对一张测试图像进行目标检测,并将检测结果可视化展示出来。该项目的主要步骤包括照片标注、图像整理、网络生成与测试。

2023-09-30

自动抢微信红包 抢红包 哈哈哈哈哈

24小时全自动抢微信红包

2023-01-21

TimeSformer预训练好的模型,TimeSformer_divST_16x16_448_K600.pyth

TimeSformer在K600上预训练好的的模型:16 of frames,spatial crop:448,acc@1:81.8,acc@5:95.8。 TimeSformer:​Is Space-Time Attention All You Need for Video Understanding?​(video transformer)

2022-09-08

TimeSformer预训练好的模型,TimeSformer_divST_8x32_224_K400.pyth

TimeSformer:​Is Space-Time Attention All You Need for Video Understanding?​(video transformer) TimeSformer在K400上预训练好的的模型:8 of frames,spatial crop:224,acc@1:77.9,acc@5:93.2。

2022-09-08

用Python语言制作一个迷宫游戏(包含BFS和DFS)

含深度搜索和广度搜索,Open表和Close表等,是一个关于迷宫游戏的报告

2021-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除