![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 51
xiexiecn
这个作者很懒,什么都没留下…
展开
-
EleutherAI GPT-Neo: 穷人的希望
前面一篇blogfinetune一个GPT3,借助openai的api finetune了一个GPT3,使用下来确实太贵,生成了1w条数据,花掉了60多美刀。肉痛,所以穷人只能想想穷人的办法,脑子就浮现出好朋友EleutherAI的GPT-Neo来。原创 2022-11-27 20:36:18 · 4109 阅读 · 4 评论 -
finetune一个GPT3模型
finetune一个GPT3模型的基本操作原创 2022-11-25 20:22:05 · 4258 阅读 · 9 评论 -
复现论文: UniTune: Text-Driven Image Editing by Fine Tuning an Image Generation Model on a Single Image
AIGC大热,每周都有大量新鲜有趣的论文出现,最新的paper基本很快就有人复现出来,包括DreamBooth, Imagic这些,这两天看到一篇Google的论文UniTune,自己尝试基于Stable Diffusion做了下复现,可能没有完美复刻,不过基本可以基于一张图片做很多好玩的事情了。代码开源于:https://github.com/xuduo35/UniTune原创 2022-11-09 20:30:15 · 752 阅读 · 3 评论 -
DreamBooth: 可cosplay,可卡通
源码: https://github.com/XavierXiao/Dreambooth-Stable-Diffusion DreamBooth是Google推出的是一种新的文本到图像个性化扩散模型,只需要几张图片,便可以微调出一个模型,用来实现带有训练图片内容的图像生成。DreamBooth基于Imagen,不开源,无法给广大网友带来福利。 外国网友基于"An Image is Worth One Word: Personalizing Text-to-Image Generation using T原创 2022-11-04 20:51:32 · 2956 阅读 · 0 评论 -
半身全身发型替换之一: 方法调研以及相关问题
提出全身半身情况下的发型替换问题和解决思路。原创 2022-10-25 22:32:21 · 478 阅读 · 2 评论 -
3秒换发型
先上几张图看效果换发型的论文非常多了,比如LOHO,HairClip,StyleClip,Barbershop。其中,hairclip以及styleclip速度快,但只能指定特定类型发型,无法实现将Person B的发型包括细节搬到Person A。LOHO以及Barbershop可以一定程度上实现这种细节搬迁,但对于人脸不是对齐的情况效果不佳,另外相当耗时,Barbershop一张图片处理需要约10分钟上下。对iOS App Store上的相关APP做了一番研究,其中有个名为B72..原创 2022-04-24 22:22:32 · 1349 阅读 · 12 评论 -
改Robust Video Matting为Robust Image Matting
Robust Video Matting是目前基于视频抠图的最优方案。它的网络和训练方法优势在于几点:1. 充分利用现有二值分割数据提取语义信息,结合高质量Matting数据集做到发丝级分割2. GRU提取帧间连续特征,稳定分割效果3. 同时支持图像和视频数据4. 支持任意分辨率输入还有几个小的trick,比如最后一层输出直接用conv+clamp不做激活。视频有视频的优势,基于视频的算法依赖于连续帧间信息,运用在只有单张图片的抠图效果并不能达到最好,基于此,我们依然可以将RVM的1、3原创 2022-01-11 08:44:28 · 1421 阅读 · 13 评论 -
正常训练stylegan的代码突然卡住的原因
ubuntu下,几分钟前才正常执行的代码,突然死活都卡在下面这行File "/home/ubuntu/torch19/lib/python3.6/site-packages/torch/utils/file_baton.py", line 42, in wait time.sleep(self.wait_seconds)分析原因,对照kernel版本,近期自动升级过,修改grub回退kernel版本重新安装驱动,还是没解决。最后google找到原因,需要清除下面这个cache下的文件锁-_-!!原创 2021-12-29 09:00:13 · 1634 阅读 · 0 评论 -
如何更加深入理解一篇深度学习CV论文
关于这个标题,简单介绍一下我自己的思路。 首先是,粗略阅读一下这篇论文,怎么算粗略,具体到每个人各有不同。至少读者需要对AI基础的东西有些了解,简单做过一些训练。在这个基础之上,如果对某个领域不那么了解,比如GAN,那么可以先找一些概念梳理一下概念。如果对论文所在领域已经比较熟悉,看过不少论文了,那么粗略就是简单通读一下就可以了。粗略阅读之后,如果发现论文的内容自己感兴趣,作者有开放源码的,可以拉下来跑一跑,看看效果,按自己的想法简单改改,做一些调整,甚至重新训练,当然也可以自己实现一遍。...原创 2021-12-23 00:26:32 · 2006 阅读 · 0 评论 -
StyleFlow介绍和相关代码
StyleFlow这篇论文看了有阵子,具体有点忘了。这篇博客只讨论人脸,StyleFlow论文本身当然不只是针对人脸来做的。作者是来自阿卜杜拉国王科技大学的Rameen Abdal, Peihao Zhu, Niloy Mitra, Peter Wonka和来自UCL, Adobe Research的NILOY J. MITRA。 StyleFlow能在保持人脸id不变的情况下,对人脸的17个属性维度(包括age, pitch, yaw, beauty, expression, gende...原创 2021-12-20 23:59:45 · 1792 阅读 · 12 评论 -
关于目标检测算法中分类准确率低的问题
请教了一下原来的同事,给了几篇文章参考,记录一下,1.double head rcnn2.revisiting the sibling head for object detector -- 商汤去年open images的夺冠模型3.Revisiting RCNN: On Awakening the Classification Power of Faster RCNN...原创 2020-06-04 00:06:37 · 2104 阅读 · 1 评论 -
cstddef not found when compiling C++ Extension - macOS
正解:https://github.com/pytorch/pytorch/issues/16805error:'cstddef' file not foundmethod: MACOSX_DEPLOYMENT_TARGET=10.9 CC=clang CXX=clang++ python setup.py install原创 2020-05-15 00:37:53 · 1278 阅读 · 0 评论 -
简单有效的实例分割CenterNet+InstanceFCN
在上一篇博文的基础上,尝试了一种简单有效的实例分割方法,InstanceFCN作为一种全卷积网络的实例(不分类)分割方案,简单有效。CenterNet做分类+bounding box检测,加上一个InstanceFCN实例输出分支,可以实现单阶段分类+bounding box检测+mask输出的有效方案,便于移动端落地。代码:https://github.com/xuduo35/CenterUnet...原创 2020-05-11 09:10:24 · 2376 阅读 · 14 评论 -
centerunet
年后试了试one stage, anchor free的centernet。训练过程发现网络稍作修改就容易出问题,训练过程中心点的结果不容易观察,在这个基础上做了一些工作,总结作如下代码:https://github.com/xuduo35/CenterUnet.git主要是几个方面的调整,1. 将centernet object detection部分代码抽出,简化代码。2....原创 2020-04-08 08:40:52 · 413 阅读 · 0 评论 -
darknet踩坑
近期在做动作识别,计划基于人脸检测,crop之后简单做个归类。由于侧脸用mtcnn之类的人脸检测算法效果并不好,加动作识别还要参考人体其他部位,最好是一次能够检测出身体多个部位的模型,测试下来,基于Open Images数据集的效果最好。开始采用google开源的tensorflow research ssd mobilenet模型,但要求tensorflow最新版本,由于原先部署在环境上的不...原创 2019-05-22 17:57:45 · 1859 阅读 · 0 评论 -
多种算法python2 & python3混合执行的简单处理
有个视频解析项目做了好几年,一台GPU服务器上需要同时跑多种算法。既有跑在GPU上的,也有跑在CPU上的;包括人脸、物体检测等多种算法。深度学习刚开始火的时候,这个项目就存在了,混合了多种框架,cuda也更新了好几个版本,多数深度学习模型开始采用python2,现在逐渐过渡到python3。最近遇到一个问题,AI模型相关算法需要用python3代码执行,其他部分CPU上跑的算法又需要在python...原创 2019-06-11 23:55:51 · 353 阅读 · 0 评论 -
分割算法的最大用途--医学
在http://arxiv-ai.com搜索了下segmentation,基本上出来的都是医学相关的论文,光25号就有下面这么几篇论文。MFP-Unet: A Novel Deep Learning Based Approach for Left Ventricle Segmentation in EchocardiographyHoVer-Net: Simultaneous Segment...原创 2019-06-26 21:53:10 · 715 阅读 · 0 评论 -
End-to-end music source separation: is it possible in the waveform domain?
文章见:http://arxiv-ai.com/discuss?id=1810.12187大多数目前成功的源分离技术使用幅度谱图作为输入,因此默认情况下省略信号的一部分:相位。为避免遗漏可能有用的信息,请研究使用端到端模型进行音乐源分离的可行性 - 它考虑了原始音频信号中可用的所有信息,包括相位。尽管在过去的几十年中,端到端音乐源分离被认为几乎无法实现,但我们的结果证实,基于波形的模型与基于...原创 2019-07-02 11:32:52 · 347 阅读 · 1 评论 -
keras的bug: 预训练模型,设置trainable为False的时候得排除BN
采用预训练模型,设置trainable为False的时候得排除BN,不然会出问题。 for layer in backbone.layers: if not isinstance(layer, BatchNormalization): layer.trainable = False网上相关讨论:https://github.com/keras...原创 2019-07-09 19:50:37 · 3043 阅读 · 0 评论 -
推荐一个pytorch框架的pretrained模型+unet牛逼的代码库
link:https://github.com/qubvel/segmentation_models原创 2019-07-09 19:51:44 · 3246 阅读 · 2 评论 -
TensorFlow Lite相关实现: On-Device Neural Net Inference with Mobile GPUs
http://arxiv-ai.com/discuss?id=1907.01989由于其较低的延迟和增加的隐私,因此期望用于移动电话的机器学习模型的设备上推断。然而,由于有限的计算能力,热约束和能量消耗,仅在移动CPU上运行这样的计算密集型任务可能是困难的。应用程序开发人员和研究人员已开始利用硬件加速器来克服这些挑战。最近,设备制造商正在使用神经处理单元进入高端手机进行设备推断,但这只占手持设...原创 2019-07-07 09:06:14 · 514 阅读 · 0 评论 -
采用mtcnn输出的特征点做人脸对齐C++代码
之前开源过一个ios项目做简单的人脸对比(https://github.com/xuduo35/ncnn-mtcnn-facenet),发现没有做人脸对齐,今天研究了下补上。1. deep insight提供的一个头文件FaceProprocess.h,见最后2. 从https://github.com/deepinsight/insightface/issues/481找来的一段code...原创 2019-07-16 15:17:06 · 1961 阅读 · 5 评论 -
mobielnet提取特征图片比对
平时pytorch用得多,tf的代码还是弄了半天,网上的code不靠谱太多。当然得先down模型,clone tensorflow models,然后执行下代码里的export。# encoding: utf-8import osimport sysimport cv2import globimport numpy as npimport tensorflow as tfim...原创 2019-07-25 19:22:28 · 715 阅读 · 0 评论 -
Kaggle蛋白质图集多标签分类竞赛
上个月和同事参加了Kaggle蛋白质图集多标签分类竞赛,获得第5,转发下同事写的Solution。https://www.kaggle.com/c/human-protein-atlas-image-classification/discussion/77731First of all, congratulations to all the winners! Thanks to Kaggl...原创 2019-01-16 14:57:44 · 1950 阅读 · 0 评论