- CV -
文章平均质量分 86
计算机视觉相关博客,人脸检测,人脸识别,目标检测,医学影像处理等
夏天|여름이다
人工智能研究员,致力于计算机视觉,自然语言处理,语音处理,多模态模型,强化学习等相关研究。
展开
-
数据集 | 人脸公开数据集的介绍及下载地址
本文介绍了人脸相关算法的数据集。原创 2024-07-06 15:20:11 · 3204 阅读 · 0 评论 -
CV | 360BEV: Panoramic Semantic Mapping for Indoor Bird‘s-Eye View理解
这篇论文提出了一种名为360BEV的专用解决方案,用于从鸟瞰图像对室内场景进行全景语义映射。提出了一种从全景图像生成整体鸟瞰视图语义映射的方法,不依赖于窄视野图像或运动线索。提出模型360Mapper,可以从全景图像预测语义标签和非模态语义映射。所提出的方法在室内语义映射基准测试中取得了最佳性能,优于现有方法。原创 2024-04-26 14:00:20 · 1202 阅读 · 1 评论 -
CV | 室内语义建图(Semantic Image Segmentation)的调研
室内语义分割论文调研~原创 2024-04-19 14:27:30 · 757 阅读 · 0 评论 -
CV | FSGS使用高斯喷溅的实时少样本视图合成论文详解与项目实现
本文是对论文通过多角度照片3D建模:FSGS模型的详解与项目实现。原创 2024-04-18 17:07:40 · 1103 阅读 · 0 评论 -
CV | 医学影像上的图像分割模型调研【更新于20240417】
mamba相关的图像分割:VM-Unet,ManbaUnet,BRAUUnet,EGE。原创 2024-03-04 13:02:04 · 1932 阅读 · 0 评论 -
YOLO | YOLO-World论文详解
腾讯出的热气腾腾的论文YOLO-World来啦~原创 2024-02-16 09:14:48 · 6308 阅读 · 0 评论 -
CV | Medical-SAM-Adapter论文详解及项目实现
本文主要讲解Medical-SAM-Adapter论文及项目实现~原创 2024-02-07 16:00:12 · 2589 阅读 · 3 评论 -
CV | SAM在医学影像上的模型调研【20240223更新版】
本文主要是SAM(Segment Anything)在医学影像上的数据集,模型及评估方法调研【持续更新】~原创 2024-02-07 12:14:16 · 1875 阅读 · 0 评论 -
生成模型 | 三维重建(3D reconstruction)调研及总结【20231219更新版】
本文是关于三维重建的论文调研,主要集中于基于图片到3d的模型~原创 2023-12-19 13:47:02 · 2096 阅读 · 0 评论 -
实用篇 | 3D建模中Blender软件的下载及使用[图文详情]
本文基于数字人系列的3D建模工具Blender软件的安装及使用,还介绍了图片生成3D模型的AI工具~原创 2023-12-10 14:15:41 · 4296 阅读 · 0 评论 -
生成模型 | 数字人类的三维重建(3D reconstruction)调研及总结【20240222更新版】
本文主要集中于图片到三维重建的算法模型的调研,其中包含人体重建,人脸重建等,博客主要集中于数字人建模的基本方法论文以及算法发展类~ 不定时更新~原创 2023-12-10 12:08:15 · 2160 阅读 · 0 评论 -
CV | Emotionally Enhanced Talking Face Generation论文详解及代码实现
本博客主要讲解了Emotionally Enhanced Talking Face Generation(情感增强的谈话人脸生成)论文概括与项目实现,以及代码理解。Code:(克隆项目下载权重后,可直接进行推理)原创 2023-06-01 15:31:41 · 2030 阅读 · 9 评论 -
论文篇 | 2010-2023,万字情绪识别(EmotionRecognition)论文总结【20231016更新】
情绪识别目前我所了解的有,基于人脸的情绪识别,基于声音的情绪识别,基于身体特征的情绪识别,基于脑电波的情绪识别,基于时空的情绪识别等。这篇博客主要是人脸表情/情绪识别(Face expression recognition/Face emotion recognition)/一般人脸情绪识别我自己把它分为image FER和 tensor FER 。有的虽然是实时检测人脸识别,因为输入是图片(image),如果输入的是视频为基础,或者带时间维度参数则属于动态人脸情绪识别。(仅表达自己分类标准,有问题可以原创 2022-04-05 19:56:50 · 6858 阅读 · 2 评论 -
数据处理 |遍历所有文件夹及子目录文件夹方法总结与实例代码详解
深度学习中不可避免的数据预处理~1. glob.glob()方法2. pathlib中的Path方法3. os.walk()方法。原创 2023-02-28 17:19:28 · 2737 阅读 · 0 评论 -
YOLO | 用YOLOv7训练自己的数据集(超详细版)
第一次训练时,在ymal文件中未设置train_list.txt和val_list.txt,可以训练,未提示错误,yaml文件如下,数据是从Rowblow上下载好的格式(不是自己的数据集)。nc: 38names: [#这里省略]个人认为默认指向路径下的图片,具体原因还在研究中。。。yolov7训练时的出来labels指的是什么,为什么每一个epoch的标签数都不同?原创 2023-02-07 15:17:45 · 27049 阅读 · 9 评论 -
数据处理| 自己的数据集json文件转txt文件(YOLO所需文件)
首先一定要明确自己的json格式,把自己的数据集设置为yolo所需要的格式。#Json文件属性不同,提取信息不同。原创 2023-02-07 10:11:00 · 9738 阅读 · 1 评论 -
YOLO | 遍历文件夹(包括子目录)内指定json文件移动或者复制到新文件夹
也可以把json换成别的关键词,优点是简单快捷,缺点是未做异常处理,默认名称一样会将之前同文件的内容覆盖。把train文件夹下的(各个文件夹下)所有json文件移动到新文件夹,只移动json文件,移动文件后,原文件夹下的子目录文件夹不变。原创 2023-02-01 12:22:00 · 301 阅读 · 0 评论 -
YOLO | YOLOv8 训练自己的数据集
YOLOv8是Ultralytics最新的基于YOLO的目标检测模型系列,提供最先进的性能。原创 2023-01-13 20:37:00 · 9556 阅读 · 0 评论 -
CV | 计算机视觉中数据集的txt,csv数据预处理代码及实例
本文使用同一个数据集进行数据预处理练习,其中包含了人脸图片文件夹,CSV文件,txt文件。原创 2023-01-02 18:29:53 · 1432 阅读 · 0 评论 -
Docker | 利用远程服务器Linux,创建一个pytorch的容器,下载GitHub上的文件并实现Layout2img项目运行(Step-by-step)
本文通过MobaXterm登录到Linux服务器上操作:(docker 容器的创建,前提是已经安装好docker并处于运行状态,可通过docker ps命令查看docker是否运行)提示脚本文件内运行不了wget(Linux从网页下载文件命令),unzip(Linux解压zip文件命令)接着下载github上的项目(在win10上看好GitHub的项目,例如我的是layout2img)想要查看并修改文件,因为是新创建的容器,所以没有这些相关库,所以全部重新安装。创建容器后直接进入docker 容器内。原创 2022-12-30 19:23:54 · 852 阅读 · 0 评论 -
C++ | 利用C++进行人脸检测,人脸识别,情绪识别
三步实现OpenCV和haarcascade简单人脸检测原创 2022-10-12 23:12:02 · 1819 阅读 · 0 评论 -
❀YOLO5学习❀基于yolo5-face结合注意力模型CBAM的数据实验
2022 04 16 21:34做一个自由浪漫的英雄主义式工程师。- insanenayolo5-face项目没有实现的朋友们可以参考我的这篇:❀YOLOv5学习❀yolo5-face论文里代码复现,实现运行_夏天|여름이다的博客-CSDN博客_yolov5人脸识别论文也可以参考俩天前写的这篇:h❀YOLO5学习❀基于yolo5-face结合注意力模型SE的数据实验_夏天|여름이다的博客-CSDN博客本博客和上片博客只不过把SE换成CBAM,方便大家粘贴代码。主要修改三个地方:.原创 2022-04-16 21:14:11 · 4179 阅读 · 8 评论 -
❀YOLOv5学习❀yolo5-face论文里代码复现,实现运行
yolov5-face是基于yolov5基础上的人脸识别,感兴趣的朋友可以先看看yolov5相关,yolov5没有论文,原创 2022-03-09 01:03:25 · 11622 阅读 · 51 评论
分享