![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
卖小麦←_←
这个作者很懒,什么都没留下…
展开
-
FastComposer: Tuning-Free Multi-Subject Image Generation with Localized Attention中文摘要
扩散模型在文本到图像生成方面表现出色,尤其在以主题驱动的个性化图像生成方面。然而,现有方法由于主题特定的微调而效率低下,因为需要大量的计算资源,而这限制了扩散模型高效部署的可能性。此外,现有方法在多主题生成方面存在困难,因为它们经常在不同主题之间混合特征。因此我们提出了FastComposer,它可以实现高效、个性化、多主题的文本到图像生成,而无需进行微调。FastComposer利用图像编码器提取的主题嵌入来增强扩散模型中的通用文本条件,只需进行前向传递即可基于主题图像和文本指令进行个性化图像生成。原创 2023-09-05 16:38:28 · 310 阅读 · 0 评论 -
深度学习预训练与MMPretrain
mmpretrain包含丰富主干网络,包括近期非常火热的主干网络(Vit,swintransformer)和经典的主干网络(vgg,resnet)等等同时也支持多模态学习,例如clip。原创 2023-06-06 09:33:58 · 188 阅读 · 0 评论 -
openmmlab 笔记7
palette = [[128,0,0],[0,128,0],[0,0,128]] 指定好对应的颜色。classes=[‘a’,‘b’,‘c’] 指定好对应的类别。用mim安装mmengine mmcv两个基础库。在github下载时加上-b dev1.x。config目录下有各种模型的demo。把语义分割和原图叠加在一张图上显示。在自己的数据集上训练语义分割模型。根据自己的cuda安装。原创 2023-02-11 16:55:08 · 130 阅读 · 0 评论 -
openmmlab笔记6
解决方法:fcn :基于低层次和高层次特征图分别产生类别预测,升采样到原图大小,再平均得到最终结果。预测图的升采样:由于卷积分类后的输出尺寸小于输入,而分割需要原图尺寸,所以需要对输出图进行上采样。2、转置卷积——可学习的升采样层 (反卷积?复用卷积计算:在滑窗上计算卷积,再将卷积核用于原图上计算特征进行分类。原图(细节丰富,语义贫瘠)—— 高层次特征图(细节贫瘠,语义丰富)按颜色分割:相同相邻颜色的像素为同一物体,按图像处理的方法分割。由于上采样得到的图比较粗糙,细节丢失严重。逐级融合高低层次特征。原创 2023-02-10 23:42:50 · 77 阅读 · 0 评论 -
openmmlab 笔记5
mmdetection 环境搭建工具 openbayes新建一个,选择gpu 镜像选pytorch数据绑定交互方式 jupyter数据集 简单的水果图片pip 安装mmdetection 依赖库pytorch。原创 2023-02-08 23:33:02 · 331 阅读 · 0 评论 -
openmmlab 笔记4
【代码】openmmlab 笔记4。原创 2023-02-07 23:47:21 · 53 阅读 · 0 评论 -
openmmlab 笔记3
openmmlab 第三天笔记原创 2023-02-04 16:45:12 · 98 阅读 · 0 评论 -
openmmlab 笔记2
今天说的内容太硬核了,每一页ppt都是一篇论文,因此记得不全经验:学习率和batch size 相关,如果batch size 放大k倍,则学习率也要放大k倍。还有一种情况,就是论文是1卡配置,你复现的时候是4卡,那也相当于是batch size放大了4倍,学习率也要放大4倍早停策略:损失率不降反升,或者停滞不前,就要cut掉数据增强:随机变换,几何变换,色彩变换,随机遮挡增强模型泛化性,扩充训练样本,减少过拟合标签平滑:类别标注可能是错,使用标签平滑训练校准网络。原创 2023-02-03 19:03:21 · 97 阅读 · 0 评论 -
openmmlab打卡笔记1
今天听了子豪兄的课,收获如下:由于不是计算机系科班出身,有一些听了就在想为什么会是这样呢,所以记得比较凌乱。原创 2023-02-02 17:47:08 · 93 阅读 · 0 评论 -
Windows 10 安装 openmmlab的mmediting
安装openmmlab下的mmediting,并测试超分辨率修复效果原创 2022-09-23 01:06:54 · 998 阅读 · 0 评论 -
简单的图像中箭头方向识别
简单的图象是箭头方向识别,对图像做卷积,从矩阵里找最大值作为这个卷积核的得分,然后四个卷积核里得分最高的那个作为这个图像箭头所指的方向原创 2022-07-13 13:04:20 · 2935 阅读 · 1 评论