自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (1)
  • 收藏
  • 关注

原创 CLIP编码器调用时刚开始正常,然后输出全部变为NaN

2、进入clip.py文件,找到函数load,在return之前加一个.float()转为fp32即可。3、如果找不到文件在哪,就debug,断点打在clip.load()这一行,然后一行一行走就进去了。参考资料:https://github.com/openai/CLIP/issues/144。网上办法不多,找了半天终于看到问题所在,但是没有说在哪里改的,故记录一下。改一下模型精度就正常了,默认的是fp16,改为fp32即可。1、找到你加载clip模型的文件,比如我的是在这。因为他默认的是加载fp16。

2024-07-08 22:38:57 164

原创 PVIC:Exploring Predicate Visual Context in Detecting Human-Object Interactions

最近,DETR框架已成为人-物交互(HOI)研究的主要方法。特别是,基于两级变压器的HOI检测器是性能最好、训练效率最高的方法之一。然而,这些通常会将HOI分类限制在缺乏细粒度上下文信息的物体特征上,避免姿势和方向信息,而倾向于关于物体身份和框端的视觉线索。这自然会阻碍对复杂或模糊交互的识别。在这项工作中,我们通过可视化和精心设计的实验来研究这些问题。因此,我们研究了如何最好地通过交叉注意重新引入图像特征。

2024-04-29 22:42:18 609

原创 VCOCO数据集评估流程

这种的话,是因为numpy在1.20版本就弃用了np.bool,需要使用bool或者np.bool_替代。首先将以下 main 函数添加到 data/v-coco 中的 vsrl_eval.py 中。首先进入到vcoco中,目录中要有vsrl_eval.py文件,没有的话就去。接下来找到需要生成检测结果的pickle文件,然后按如下方式进行评估。vslr_annot_file:VCOCO 注释的路径。coco_annot_file:Coco 注释的路径。找到vsrl_eval.py,把其中的替换了就行了。

2024-04-27 16:52:28 285

原创 模型评估指标以及一些变量含义

与 mAP rare 相对应,指的是在非稀有类别上的平均精度。非稀有类别是指在数据集中出现频率较高的类别。这个指标可以告诉你模型在运行过程中最大的内存需求,通常以字节(bytes)或者更大的单位(如千兆字节、兆字节)来表示。: 通常指的是在稀有类别上的平均精度。稀有类别是指在数据集中出现频率较低的类别。: 可能指的是特定论文(thesis)中提到的平均精度。: 整体平均精度,是所有类别平均精度的平均值,表示模型在所有类别上的综合性能。: 指的是在所有类别上的平均精度,与 “mAP” 的含义相同。

2024-04-27 16:18:38 164

原创 chrome浏览器在看b站时偶尔突然闪屏,出现大片黑方块

暂无比较好的解决方式,目前最好的方法就是将浏览器设置成高性能模式,然后其他方法也有,具体可以参考这个视频和评论:https://www.bilibili.com/video/BV12H4y1Z7mD。据目前所知是老bug了,广泛出现在40系高端显卡上,由于新工艺导致的显卡在静止时压低功率,此时浏览器调用gpu就会闪屏,出现大片黑方块,闪一下又好了。如果后台挂着游戏或者壁纸等之类调用到gpu的软件,就不会出现。比如在浏览评论区或者回复别人的评论的时候会出现。

2024-04-01 23:00:48 1074

原创 软件右上角出现一个麦克风和箭头标志,还点不了

按alt+z打开英伟达面板,然后右边有个齿轮也就是设置,打开后点hud布局,然后状态指示器,选择关闭即可。

2024-04-01 18:43:02 305

原创 Vision mamba调试

如果显示版本和nvidia-smi对上了,那就可以配置多版本cuda,也就是额外下载一个11.6以上的。首先查看nvcc -V版本多少,如果显示找不到命令则是cuda没有装好。如果显示版本和nvidia-smi对不上,那也是没有装好。很正常等几分钟,还卡就断了重新执行。

2024-03-22 23:37:31 571

原创 ubuntu和windows配置nps内网穿透达到远程访问ssh和网站的效果

nps和frp都可以内网穿透,但是实测frp没那么稳定,吞吐量大的时候我的电脑上会断连,所以最后使用nps效果:远程访问本地电脑网站,或者ssh连接主机主要由于学校有个电脑A连校园网,可以访问学校的内网服务器B,我自己笔记本C正常连不上B,然后我在A上做个内网穿透就可以用C连A,然后再ssh连B。然后我连接上后可以通过screen命令开两个终端,一个用来操作A,一个用来操作B,切换也方便,不用每次都重新连接。

2024-01-30 15:33:23 1869

原创 HOICLIP:Efficient Knowledge Transfer for HOI Detection with Vision-Language Models

解释人物交互概念:人与物体交互(HOI)检测旨在定位人与物体对并识别他们的交互,是全面理解视觉场景的核心任务引出相关领域:近年来,它因其在广泛应用中的关键作用而引起了越来越多的兴趣,例如辅助机器人、视觉监控和视频分析当前的领域研究发展:由于端到端对象检测器的发展,最近的研究在交互中定位人对象实例方面取得了显着进展引出现在所面临的挑战:识别人与物体对之间的交互类别的问题仍然特别具有挑战性。传统方法及其局限性:传统策略只是学习多标签分类器,通常需要大规模带注释的数据进行训练。

2023-11-23 20:27:03 491 1

原创 End-to-End Human Object Interaction Detection with HOI Transformer(CVPR2021)

这是CVPR2021年的一篇论文,主要是作者提出了一种端到端的HOI检测方法,基于Transformer结构。作者总结了以前的研究工作以及方法,基本上目前的HOI研究主要有三种:两阶段、一阶段、端到端。如图所示:两阶段方法:先进行目标检测,找到人和物体的框以及类标签,然后再通过使用multi-stream架构来预测人和物体的交互对。由于顺序和分离的两级架构,这些方法复杂度高且效率低。一阶段方法:引入了交互点的概念,同时对交互点以及边界框进行预测,然后再通过算法将交互点和对象对进行匹配。

2023-07-13 13:54:25 351 1

原创 关于Anaconda的一些配置

修改ubuntu终端使其默认激活conda base环境。这一项有时候不一定有用,该装不上还是装不上。查看当前环境用conda装的包。然后在最后一行追加以下代码。然后关闭终端,执行以下命令。安装第三方包(以下二选一)不过建议有时候用这个装。

2023-07-03 19:59:23 118 1

原创 DFR: Deep Feature Reconstruction for Unsupervised Anomaly Segmentation

然后是这个区域特征生成器,下边这张图是它的一个具体结构,首先将来自不同感受野的特征图进行resize,变成输入图像的空间大小,然后用均值滤波器对其进行卷积,最后将其拼接得到融合的特征图f(x),这个特征图是多尺度的。作者他们在mvtec上做了实验,这里是它的一个实验结果,从右边图中可以看到除了作者的这个网络,还有一个ST-M效果也不错,但是它需要同时训练几个不同的网络,而作者这个模型只需要训练一个重建网络,更加灵活。这篇论文讲的是一个基于重建的无监督异常检测网络结构。

2023-06-13 13:39:43 271

原创 Combining GANs and AutoEncoders for Efficient Anomaly Detection

作者他们说像VAE这样的自动编码器的生成模型会为逼真的图像生成模糊重建,而他们参考的模型BiGAN虽然将自编码器和GAN进行了结合,但是重建的样本往往是错位的,因为鉴别器只关注重建出来的图像是否像真实的,而不会保证精确地重建它,所以作者他们在BiGAN上做了改进,并提出了CBiGAN。最后是他们的一个效果图,作者他们和他们参考的网络做了对比,左边是数据集中的有缺陷的图,然后是重建图像以及重建和原图的对比,可以看到EGBAD虽然能够重建图像,但是和原图的差距还是比较明显的,而作者他们重建的图像都比较精确。

2023-06-13 13:38:24 102

原创 Industrial Anomaly Detection with Domain Shift: A Real-world Dataset and Masked Multi-scale Reconstr

首先作者提出了一个叫AeBAD的数据集,由航空发动机叶片组成,该数据集分为两部分,一个S和一个V,S代表单个叶片的图像,V是一个包含多个叶片的视频,其中训练集仅包含正常样本,测试集包含正常和异常两种样本,异常样本主要有四种类型:击穿、烧蚀、沟槽、断裂。然后右边这个公式是它的异常评分函数,这两个z分别是上边两个部分输出的特征向量,然后分别按行归一化后得到的结果,经过运算后得到的结果进行上采样到原始图像的分辨率得到一张热图,取其中的最大值为这张图象的异常分数。

2023-06-13 13:30:53 305

原创 aubo机械臂SDK+python+anaconda3配置

aubo SDK ubuntu配置指南

2023-06-05 13:49:23 542

原创 neo4j图数据库的安装

打开网页需要填写账号和密码进行连接,第一次账号为neo4j,密码为neo4j,第一次登录后会提示重置密码,字符不少于8位。接着配置neo4j的环境变量,将压缩包下载之后,解压到自己想放的目录,然后找到bin文件,复制路径,配置环境变量。首先安装JDK,打开上边链接,进去后找到相对比较新的版本,选择Windows版本,exe版本的,进行安装。然后安装neo4j,打开链接下载一下,选择社区版,找到Windows,下载压缩包。首先是JDK,win+r快捷键,输入cmd打开命令行,输入。

2023-04-22 22:10:18 156

原创 SAPIEN: A SimulAted Part-based Interactive ENvironment

但是构建仿真环境主要面临以下四个挑战:首先是对物理规则的重现,但是完美重现是不太可能的,一般都是近似实现,第二点是仿真环境中的机器人应当与真实机器人行为与参数一致,这样才能训练后无缝过渡到现实世界,第三是环境需要产生物理上准确的效果图,以此来减轻视觉上的差距,最后是环境需要足够的内容、场景和对象供机器人进行交互。然后就是同步和异步模式,同步模式中仿真和客户端结合在一起,异步模式下他们是分开的,在该模式下,模拟机器人和真实机器人的接口是相同的,这使得后期在进行迁移的时候不用做额外的设置。

2023-03-28 13:56:13 537

原创 Ditto in the House: Building Articulation Models of Indoor Scenes through Interactive Perception

最后是迭代完善,作者通过上边两步进行实验,发现大部分这种部件,他们在互动的时候只有10%的部件打开的幅度超过30°,然后他们设计了迭代更新的方法,通过机器人互动来修正当前建立的模型,比如通过选择离当前预测的关节轴最远的交互热点作为下一个交互的位置,将点到轴的垂直方向作为力的方向,之后作者通过实验验证了他们的方法的效果,首先是下边的表,他将他们的方法和另外一个做了比较,结果显示他这个模型的精度比另一个高,也就是机器人对他们预测的可交互部分进行交互,作者的方法预测的部分中,可交互部件的数量更多。

2023-03-28 13:47:36 60

原创 TWO-STREAM DECODER FEATURE NORMALITY ESTIMATING NETWORK FOR INDUSTRIAL ANOMALY DETECTION

关于这个FNE模块,在训练的时候,他将异常解码器预测的图像作为groudtruth,然后将F和M调整成同样的大小,然后使用结构相似性指数作为度量,计算他们之间的信道方向距离,然后将计算出来的值进行归一化得到Wgt,然后左边的F经过三层MLP后通过sigmoid函数生成W’,训练时对他们之间的交叉熵损失LFNE进行最小化。然后接下来就是他们模型的一些效果图,上边的图展示了他们的模型对异常图像的识别,下边的图展示了他们模型对图像的重建,并和其他的模型作了比较。

2023-03-28 13:41:25 78

原创 EdgRec(Reconstruction from edge image combined with color and gradient difference)

然后是关于重建网络,作者说对于异常检测来说,添加跳跃连接是有风险的,因为这些浅层编码特征可以直接传输到最终解码层,这增加了模型生成身份图的风险,但是由于他们的编码特征和解码的内容非常不同,输入是灰度边缘图,输出是RGB图,然后根据实验结果看来,他们发现使用跳跃连接可以提高他们的性能。然后这个是它的色差函数,Ir是重建图像,I是原始图像,fmean用来平滑最终结果。最后就是他们在MVTec上的实验结果,上边是图像级的,下边是像素级的,然后作者他们的实验结果在最右边,从结果来看,整体效果还是不错的。

2023-03-28 13:37:17 254

原创 Multiresolution Knowledge Distillation for Anomaly Detection

教师网络是在imageNet上预训练的VGG-16网络,学生网络是一个简化的VGG-16网络,训练过程中输入正常图片到两个网络中,通过教师网络对学生网络进行指导,算出损失函数,进行反向传播,迭代运算。对于异常定位,这里是通过寻找损失的梯度变化比较大的地方,因为在测试时,如果输入的是异常数据,那么教师和学生两个网络学到的特征就不一样,损失如果进行反向传播,梯度变化就会比较大。这篇论文主要讲的是作者设计了一种方法,通过知识蒸馏训练学生网络,然后对教师网络和学生网络输入,观察结果来达到缺陷检测。

2023-03-28 13:34:31 276

原创 OCR-GAN(Omni-frequency Channel-selection Representations for Unsupervised Anomaly Detection)-无监督异常检测

基于重建多频率解耦的无监督异常检测

2023-03-27 14:27:24 887

原创 阿里云ACA云计算助理工程师

资格是去年疫情在家,领的那个服务器带的资格,今天刚和朋友一起考过去题库我也没找到,但是在看视频的过程中我和朋友把PPT都截了下来,有需要的可以去我的资源里下载一下

2021-04-25 21:38:41 335

原创 关于layui的表格数据(前端HTML+后端SSM)——显示数据

先上代码前端html<table class="layui-hide" id="test" lay-filter="test"></table>前端js<script src="../layui/layui.js" charset="utf-8"></script>前端layuilayui.use('table', function(){ var table = layui.table; $=layui.jquery;

2020-12-14 16:16:13 3143 7

原创 vue-cli及node.js的安装和查看

node.js的安装去官网下载安装包并进行安装https://nodejs.org/zh-cn/node.js的查看cmd运行以下指令,如果显示版本号则安装成功node -vvue-cli的安装cmd运行以下指令进行安装npm install vue-cli -gvue-cli的查看cmd运行以下指令,显示版本号则安装成功vue -V因为默认的是国外的源,如果速度慢或者卡住可以换成阿里的源友情链接...

2020-12-03 16:08:54 419 2

转载 win10家庭版打开组策略

win10家庭版打开组策略网上搜到很多方法,大致上都是说新建个文本文档,复制一些内容进去,另存为.bat或者.cmd格式,然后运行即可。但是我通过实践证明还是不行,网上有种说法是windows家庭版1607之后就没办法通过cmd脚本进行安装,不知道是不是因为这个,反正我是闪退了这里不讲通过cmd安装,有兴趣可以去网上搜索,90%的答案都是通过cmd安装的。这里分享另外一个大佬的方法原链接管理员运行Windows PowerShell,粘贴以下代码Get-ChildItem -Path "C:\W

2020-11-23 22:32:08 206 1

原创 阿里云 ECS 7 天实践训练营进阶班 - day02 - 快速搭建Docker环境

阿里云 ECS 7 天实践训练营进阶班 - day02 - 快速搭建Docker环境准备阶段开通服务器连接服务器配置阶段配置Docker配置阿里云镜像仓库测试阶段安装Nginx服务测试准备阶段开通服务器同样的,首先需要开通一台服务器,这里我们用阿里云提供的免费的为例,点击免费开通,然后稍等1分钟左右等待开通完成连接服务器记录下信息,通过Xshell或者终端等工具与服务器进行连接到这里准备进行配置Docker CE,如果对上边有疑问的话,可以去我上一条博客里看一下传送门配置阶段Docke

2020-09-24 17:46:04 132

原创 阿里云 ECS 7 天实践训练营进阶班 - day01 - 基于ECS搭建FTP服务

阿里云 ECS 7 天实践训练营进阶班 - day01 - 基于ECS搭建FTP服务准备阶段创建阿里云ECS连接阿里云ECS配置阶段安装vsftpd配置vsftpd测试阶段准备阶段要想实现FTP功能,肯定要先有服务器,接下来我们就先创建一台ECS创建阿里云ECS首先进入场景,然后选择开始体验,进去之后点击免费开通大概等1分钟左右就会自动开通,到这一步我们就创建完成了。连接阿里云ECS创建好之后,我们需要从本地连接到服务器才能进行操作。首先我们通过win+R打开window终端,然后输入s

2020-09-23 21:37:19 264 1

SAPIEN仿真环境资料包

自己制作的ppt和稿子

2023-03-28

OCR-GAN(Omni-frequency Channel-selection Representations)

PPT+稿子+论文(OCR-GAN)无监督异常检测论文

2023-03-27

阿里云ACA考试配套视频里PPT的图片

ACA云计算助理工程师那个考试配套的视频里面ppt的图片

2021-04-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除