自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 收藏
  • 关注

原创 Paper Reading: MixTeacher:半监督目标检测中利用混合尺度教师挖掘有前景的标签

题目:《MixTeacher: Mining Promising Labels with Mixed Scale Teacher for Semi-Supervised Object Detection》,CVPR 2023日期:2023.3.16单位:腾讯,上海交通大学,浙江大学,荣旗工业科技公司论文地址:http://arxiv.org/abs/2303.09061作者。

2024-04-11 23:31:49 1060 1

原创 Paper Reading: 用于半监督实例分割的指导蒸馏, Guided Distillation for Semi-Supervised Instance Segmentation

题目:《Guided Distillation for Semi-Supervised Instance Segmentation》,用于半监督实例分割的指导蒸馏,WACV(计算机视觉应用冬季会议,未进入CCF)日期:2023.12.14单位:FAIR, Meta, 格勒诺布尔-阿尔卑斯大学论文地址:https://arxiv.org/abs/2308.02668作者摘要尽管实例分割方法已经有了很大的改进,但主要的范例是依赖于满符号的训练图像,这很难获得。

2024-04-11 17:08:02 771

原创 车牌检测(分割+识别)

目标检测项目-3

2024-02-28 16:50:12 434

原创 人脸特征比对

目标检测项目-2

2024-02-27 22:52:44 306

原创 人脸检测+特征提取

目标检测项目-1

2024-02-27 20:15:55 312

原创 《矩阵分析》笔记

TVTα∣α属于VTV={Tα|α属于V}TVTα∣α属于V像子空间是由V中所有元素的像Tα构成的(Tα是α通过线性变换T得到的,α∈V)T−10kerTα∣α∈VTα0T−10kerTα∣α∈VTα0核子空间中的元素α在线性变换T的作用下转换为0例如:投影变换{(x1, x2, x3)}三维空间​ T(x1, x2, x3) = (x1, x2, 0)1, x2, 0)},二维空间,维数为23。

2024-01-08 21:06:57 1195 1

原创 Paper Reading: (InPL) 不平衡半监督学习中的分布内伪标记优先

题目:《InPL: Pseudo-labeling the Inliers First for Imbalanced Semi-supervised Learning》,ICLR’23​ InPL:不平衡半监督学习中的分布内伪标记优先日期:2023.2.2单位:威斯康星大学麦迪逊分校论文地址:https://openreview.net/forum?GitHub:-作者Zhuoran Yu研究领域:之前是目标检测,今年发了两篇半监督相关的,一个是这篇,一个是人体姿态估计。

2023-12-13 20:10:09 150

原创 Paper Reading: (CCVC) 基于冲突的半监督语义分割跨视图一致性

题目:《Conflict-Based Cross-View Consistency for Semi-Supervised Semantic Segmentation》,CVPR’23, 基于冲突的半监督语义分割跨视图一致性日期:2023.5.2单位:悉尼大学,香港大学,三星研究所论文地址:https://arxiv.org/abs/2303.01276作者Zicheng Wang,找不到Zhen Zhao个人主页:http://zhaozhen.me/Xiaoxia Xing,找不到。

2023-12-13 19:55:22 149

原创 Paper Reading: (U2PL) 基于不可靠伪标签的半监督语义分割

题目:《Semi-Supervised Semantic SegmentationUsingUnreliablePseudo-Labels》,CVPR’22​ U2PL: 基于不可靠伪标签的半监督语义分割日期:2022.3.14单位:上海交通大学, 香港中文大学, 商汤科技论文地址:https://arxiv.org/abs/2203.03884项目地址:https://haochen-wang409.github.io/U2PL/

2023-12-13 19:28:55 203 1

原创 Paper Reading: (ACRST) 基于自适应类再平衡自训练的半监督目标检测

题目:《Semi-Supervised Object Detection with Adaptive Class-Rebalancing Self-Training》,AAAI’22, 基于自适应类再平衡自训练的半监督目标检测日期:2021.7.11(v1),2022.6.28(AAAI’22)单位:清华大学论文地址:https://arxiv.org/abs/2107.05031GitHub:-作者。

2023-12-13 15:21:15 233

原创 Paper Reading: (SAA)半监督学习中通过样本自适应增强提高样本利用率

题目:《Enhancing Sample Utilization through Sample Adaptive Augmentation in Semi-Supervised Learning》,​ 半监督学习中通过样本自适应增强提高样本利用率日期:2023.9.7单位:南京大学,悉尼大学,东南大学论文地址:http://arxiv.org/abs/2309.03598作者第一作者找不到眼熟的第二作者赵振,个人主页:http://zhaozhen.me/其他作者(略)摘要。

2023-11-04 12:56:24 201

原创 Paper Reading: (S3OD)重新思考航空图像半监督目标检测中的尺度不平衡

题目:《Rethinking Scale Imbalance in Semi-supervised Object Detection for Aerial Images》,重新思考航空图像半监督目标检测中的尺度不平衡(已提交IEEE)日期:2023.10.23单位:武汉大学,北京空天地一体化信息技术国家重点实验室论文地址:Rethinking Scale Imbalance in Semi-supervised Object Detection for Aerial ImagesGitHub:作者

2023-11-04 12:07:49 134

原创 Paper Reading: (ShrinkMatc)缩小类空间以提高半监督学习的确定性

题目:《Shrinking Class Space for Enhanced Certainty in Semi-Supervised Learning》,ICCV 2023​ 缩小类空间以提高半监督学习的确定性日期:2023.8.13单位:香港大学、南京大学、上海AI Lab、悉尼大学、东南大学论文地址:https://arxiv.org/abs/2308.06777GitHub:https://github.com/LiheYoung/ShrinkMatchLihe Yang个人主页:https:

2023-11-04 11:45:00 117

原创 基于PyQt5和OpenCV库的简单的文档对齐扫描应用程序

使用python语言,基于PyQt5和OpenCV库的简单的文档对齐扫描应用程序。

2023-10-22 13:58:23 248

原创 Paper Reading:《Consistent-Teacher: 减少半监督目标检测中不一致的伪目标》

商汤、上海AI实验室、新加坡国立大学、北京大学作者研究方向主要是模型架构研究、半监督学习、目标检测共同一作个人主页:https://adamdad.github.io/其他作者摘要在本研究中,我们深入研究了半监督目标检测(SSOD)中伪目标的不一致性。我们的核心观察结果是,振荡的伪目标破坏了精确探测器的训练。它给学生的训练注入了噪音,导致了严重的过拟合问题。因此,我们提出了一个系统的解决方案,称为Consistent Teacher,以减少不一致性。首先,自适应锚分配(ASA)

2023-10-20 00:19:00 939

原创 MMDet初尝试:以官方文档为例,训练模型

按照官方文档配置环境:https://mmdetection.readthedocs.io/zh_CN/3.x/get_started.html安装conda/Miniconda创建并激活一个 conda 环境安装PyTorch(GPU平台)使用 MIM 安装 MMEngine 和 MMCV安装 MMDetection验证 MMDetection 是否安装正确下载配置文件和模型权重文件运行以下命令进行验证你会在当前文件夹中的文件夹中看到一个新的图像demo.jpg,图像中包含有网络预测的检测框。

2023-09-28 12:54:26 205

原创 Paper Reading: RSPrompter,基于视觉基础模型的遥感实例分割提示学习

题目:《RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation based on Visual Foundation Model 》,基于视觉基础模型的遥感实例分割提示学习日期:2023.6.28单位:北航、北京数字媒体重点实验室、虚拟现实技术与系统国家重点实验室、上海人工智能实验室论文地址:https://arxiv.org/abs/2306.16269作者:陈科研。

2023-09-15 18:20:37 695

原创 本地部署体验LISA模型(LISA≈图像分割基础模型SAM+多模态大语言模型LLaVA)

我下载了LISA-13B-llama2-v0-explanatory(别下这个,我当时是因为作者只发布了两个版本,才下的,后面没用上,要下就选择v1的版本,内存大的下13B,小的下7B)解决:“pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple/”之前https://www.lfd.uci.edu/~gohlke/pythonlibs/也可以下载whl,现在点进去是这样的下不了了。

2023-08-31 14:29:54 1224 3

原创 Paper Reading:《LISA: Reasoning Segmentation via Large Language Model》

LISA: Reasoning Segmentation via Large Language Model》基于大型语言模型的推理分割日期:2023.8.1(v1)单位:香港中文大学,思谋科技,微软亚洲研究院论文地址:https://arxiv.org/abs/2308.00692作者:赖昕,香港中文大学三年级博士生,师从贾佳亚教授。主要研究方向是三维点云感知,迁移学习,半监督学习,小样本学习。已发表顶会顶刊论文8篇,其中一作4篇。同等贡献其他作者(Jiaya Jia:贾佳亚)

2023-08-12 23:07:09 420 1

原创 Paper Reading:《Segment Anything in High Quality》

Segment Anything in High Quality》高质量的分割任何内容日期:2023.6.2单位:苏黎世联邦理工学院,香港科技大学论文地址:https://arxiv.org/abs/2306.01567作者:柯磊个人主页:http://www.kelei.site/与SAM相关的paper提出模型:SAM-PT,一种将稀疏点追踪与 SAM 相结合用于视频分割的方法通过级联注意力提高DETR的通用检测精度。

2023-08-12 22:33:14 213

原创 Paper Reading:《Semantic-SAM: Segment and Recognize Anything at Any Granularity》

Semantic-SAM: Segment and Recognize Anything at Any Granularity(语义-SAM:多粒度、多语义的统一分割模型单位:香港科技大学,微软, IDEA,威斯康星大学麦迪逊分校,香港大学,清华日期:2023.7.10第一作者:李峰本文简述:Semantic-SAM是一个在多个粒度(granularity)上分割(segment)和识别(recognize)物体的通用图像分割模型。和SAM相比,该模型有两个优点:(1) 语义感知,即模型能够给分割出的实体

2023-07-31 22:46:21 178

原创 Paper Reading: 《HIPIE:Hierarchical Open-vocabulary Universal Image Segmentation》

​ 分层的,开放词汇的通用图像分割单位:加州大学伯克利分校,松下人工智能研究;日期:2023.7.3第一作者:王旭东,研究领域:计算机视觉、机器学习。通过消除预定义对象类和粒度的约束,HIPIE为图像分割提供了更灵活、适应性更强的解决方案。HIPIE:v名词解释:Open-vocabulary:核心思想与zero-shot类似,在都是。

2023-07-30 17:28:26 210

原创 Paper Reading:SAM & FastSAM & MobileSAM 的简单介绍

今年4月,Meta AI公开了Segment Anything Model(SAM),分割一切模型论文:2023年4月5日v1发布于arXiv线上体验demo网站地址:https://segment-anything.com/现已收录ICCV2023(影响因子IS:40.60目标。

2023-07-19 23:45:35 451

原创 基于YOLOv8的口罩检测项目

距离上一次发博客都过去一个多月了,期间不是没有在学习,也保持着记笔记的习惯,但由于刚入门ML/DL的领域,能力也一般,现阶段学的很多东西都很基础,很多时间都在看各路大佬们的课、博文或是读论文,笔记里很多内容都是在收集别人的知识产物,整理时也没有很有条理,根本不是能作为博客发布的状态,所以就一直存放在本地了…害,希望接下来能多有自己的产出吧orz。修改文件:/content/YOLOv8/ultralytics/ultralytics/yolo/v8/detect/train.py中model和data。

2023-06-21 20:37:37 690 2

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:4/7 Diffusion Model 原理剖析(optional)

4:从平均值(mean)=0,方差(variance)=1的normal distribution中sample出ε,大小与image一致,是一张全是噪音的图片。我们会发现,噪声只由β序列和xt-1所决定(固定的而非可学习的过程),且生成xt-1时只依赖于xt,可以得出在添加噪声的过程中,是一个马尔科夫链过程,进而得出。αT),得到带有噪音的图片(α越大得到的图片带有的噪音占比越大);注意,在得到的式子中只有ε是需要通过神经网络来预测的(其他的参数都是已经定好的或是可以推算出来的)):预测生成的噪音图片;

2023-05-07 17:47:10 859 1

原创 生成网络-学习笔记 鲁鹏-北邮-2020/6/2

与GAN相比,产生的图像比较模糊,质量低。但只是混合高斯模型,只能解决有限个的对应关系(即m个),所以我们将P(m)替换为一个分布函数,用函数来对应,就能产生无数组的对应关系。VAE的编码器与自编码器不同,自编码器是直接得到输出z(编码),而VAE的编码器输出是一个概率分布,其中m为分布均值,σ为分布方差。A:解码器只能生成已有的图片,如输入满月与半月的图像,希望生成中间状态的月亮,只是用解码器是无法实现的。2. 训练完后的编码器作为有监督学习的初始特征提取模型(利用少量有标签的数据,训练最终的网络)。

2023-05-03 18:34:32 133

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:3/24机器如何生成图像

文字输入decoder,用于限制图像生成的范围,Encoder输出一个向量,交给decoder,希望还原回一样的图像,encoder和decoder一起训练,希望生成的图像约相似越好同时要对encoder生成的向量做限制,强制其是normal distribution训练encoder,输入一张图片输出一个向量,并保证这个向量是可逆的(大小与输入图像一致),多个向量组成normal distribution,输入encoder得出生成图像。

2023-05-02 00:02:14 775 1

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:3/17 大模型+大资料=神奇结果?

由于过于庞大,结构与一般的transformer有所差异,大模型中包含许多模组,每次执行任务时只调用部分模组(训练所有的参数,但使用时只使用部分参数,为了节省inference的资源)结论:大模型在输出不确定的答案时会不自信(知道自己不知道答案),小模型不太受影响。总所周知,大体量的模型+大量的数据,会得到更好的模型,可是原因是什么呢?横轴:LM输出的下一个字的概率(是模型选择的输出,不一定正确)不同颜色代表不同大小的模型(黄色代表的模型最大),1.6T(PaLM的3倍,GPT3的10倍)

2023-04-29 20:56:12 425

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:3/10机器如何生成文句

相关论文:Transfer Text-to-text Transformer(T5,超长论文67页),使用的训练集:Colossal Clean Crawled Corpus(C4,一个超大的训练集,大小有7P)3.Least-to-most prompting:先让机器自己将问题进行拆分,再将问题和拆分后的问题一起给机器,让他接龙。2.使用Self-consistency的方法:让机器产生多个答案,选概率高的作为答案。输入D、Q序列,输出s、e(答案在文章中的起始位和终止位,直接截取文章),生成答案A。

2023-04-28 23:19:44 623 2

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:3/3 机器学习基本概念介绍

机器学习 ≈ 机器自动寻找一个函数f例如:chatGPT:输入:“什么是机器学习”通过函数f,输出:“机”Midjournery:输入:一只可爱的猫,通过函数f,输出:一张猫猫图片Regression(回归)与Classification(分类)Regression:函数的输出是一个数值例如:输入输入今天的PM2.5值、温度、臭氧量等,输出明天的PM2.5值Classification:函数的输出是一个类别(选择题)例如:判断一封邮件是否为垃圾邮件。

2023-04-22 16:46:35 615 2

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:前言

课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub:https://github.com/Fafa-DL/Lhy_Machine_Learning目录2/24 正确认识chatGPT3/3 机器学习基本概念介绍3/10 机器如何生成文句3/17 【生成式AI】大模型+大资料=神奇结果?3/24机器如何生成图像4/7 Diffusion Model 原理剖析(optional)4/21 基石模型的各种变形4/28 基石模

2023-04-22 16:39:58 645

原创 python学习笔记

各种杂七杂八的python相关知识笔记,持续更新(希望吧XD)

2023-04-19 16:38:14 110

原创 李宏毅-2023春机器学习 ML2023 SPRING-学习笔记:2/24 正确认识chatGPT

李宏毅-MACHINE LEARNING 2023 SPRING学习笔记【持续更新!希望吧orz】

2023-04-19 16:08:52 606

原创 《C程序设计(第三版)》-谭浩强——学习笔记

变量分类:1、从变量的作用域(空间角度):全局变量与局部变量2、变量值的存在时间(生存期):静态存储方式与动态存储方式静态存储方式:程序在运行期间由系统分配固定的存储空间的方式动态存储方式:在程序运行期间根据需要进行动态分配存储空间的方式程序区:静态存储区:部分数据,全部的全局变量动态存储区:存放部分数据,如函数形参、未加static声明的局部变量(自动变量)、函数调用时的现场保护和返回地址。

2023-03-20 20:01:29 183

原创 《计算机组成原理》

一、计算机系统概述·计算机硬件系统=运算器+存储器+控制器+输入、输出设备·(集成到一个芯片上)运算器+控制器=CPU(中央处理器)·计算机软件分为:系统软件(OS/DBMS)、应用软件(应用程序)·语言(从低到高):机器语言,汇编语言,高级语言·翻译程序:高级语言转为机器语言,分为:解释/编译解释:逐条翻译,立即执行,不会生成目标程序编译:一次性翻译为目标程序(会生成目标程序)后执行,时间长,运行速度比解释快·汇编:把汇编语言源程序翻译为机器语言程序的翻译程序·从源程序到可执行文件:预

2023-03-07 09:35:01 1092 3

原创 《计算机网络》

第一章 计算机网络体系结构1.1 计算机网络概述·计算机网络主要由硬件、软件、协议组成硬件:主机(端)、通信链路(双绞线、光纤)、交换设备(路由器、交换机)通信处理机(网卡)软件:如网络操作系统、邮件收发程序、FTP程序、聊天软件等,多属于应用层协议:计算机网络等核心·计算机网络等核心部分:路由器;边缘部分:主机·从功能上看,计算机网络=通信子网+资源子网通信子网:各种传输介质、通信设备和相应的网络协议资源子网实现资源共享功能的设备及其软件的集合·计算机网络功能:数据通信、资源共享、分布

2023-03-07 09:31:07 1933

原创 《操作系统》

第一章 计算机系统概述1.1 OS基本概念·操作系统Opearting System:控制和管理整个计算机系统的硬件与软件资源,合理地组织、调度计算机的工作与资源的分配,进而为用户和其他软件提供方便接口与环境的程序集合,是计算机系统中最基本的软件·OS的特征:并发、共享、虚拟和异步并发:通过分时使计算机系统中同时运行多个程序(需要相关硬件的支持)共享:资源共享,分为互斥共享(临界资源)和同时访问方式(磁盘)虚拟:虚拟处理器/内存/外部设备,从逻辑上扩充存储器的容量,时分复用技术异步:程序的执

2023-03-07 09:29:23 280

原创 算法基础知识

一、算法的特征1、有穷性:算法在执行有限步之后必须终止。2、确定性:算法的每一个步骤必须有确切的定义。3、可行性:在有限时间内完成计算过程。4、输入:一个算法有0个或多个输入,作为算法开始执行前的初始值或初始状态。5、输出:一个算法有一个或多个输出,以反映对输入数据加工后的结果。二、算法的设计1、穷举搜索法(Exhaustive Search Algorithm)对可能是解的众多候选解按某种顺序进行逐一枚举和检验,并从中找出那些符合要求的候选解作为问题的解。特点:算法简单;运行花费时间大

2023-03-07 00:01:03 84

原创 《数据结构》

2022.4第一轮复习复习顺序为《数据结构》、《组成原理》、《操作系统》、《计算机网络》复习教材《王道考研复习指导》慢慢更新。。。目录绪论线性表栈、队列和数组串树与二叉树图查找排序绪论线性表栈、队列和数组串树与二叉树F:森林;B:二叉树;T:树F–>B,B中右指针域为空的数量=F中非终端结点数+1T–>B,T的后序遍历=B的中序遍历F–>B,F中叶结点数=B中左孩子指针为空的结点数数的边数=结点数-1,e=n-1WPL:带权路径长度图无向图中,所有结

2022-07-13 16:13:34 381

原创 操作系统阶段测试3-文件系统+输入输出+死锁

某一个磁盘共有16个盘面,每个盘面上从外到内共有30000个磁道(或称30000个柱面),每个磁道有250个扇区。假定存储信息时以一个扇区作为一个存储块,盘面号(磁头号)、磁道号和扇区号均从0开始编号,那么,盘块号1002578对应的盘面号、磁道号和扇区号是(2,250,161)。解答: ①先求磁盘号(柱面号)=1002578/(16×250)=1002578/4000=250……2578[解释]16×250盘面数×扇区数一个磁道(柱面)的存储块数∴250为磁道号②通过余数求盘面号和扇区号:..

2021-12-28 12:47:02 588

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除