![](https://img-blog.csdnimg.cn/2019091813595558.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
AI前沿论文阅读
文章平均质量分 79
分享最新的一些论文
Qodicat
哈嘿!AI野生探险家,一起探索AI世界的无限可能
有任何问题欢迎给我留言
展开
-
【论文阅读】AttnDreamBooth | 面向文本对齐的个性化图片生成
(1) Textual Inversion:容易出现过拟合概念的情况(即只看到概念,而忽视其他的prompt) 对于text embedding做注入。最经典的比如一些好玩的动漫人物的概念,SD大模型本身是不知道这些概念的,但是通过概念注入是可以实现的从而生成对应的动漫人物。(2)DreamBooth:容易忽视概念(即可以看到其他prompt,不能看到概念)对于原本的扩散模型做微调。使用灵活的文本控制可以实现一些特定的概念的注入从而实现个性化的图片生成。两个主要的传统的实现方式。方法由三个训练阶段组成。原创 2024-06-16 22:24:54 · 302 阅读 · 0 评论 -
【论文导读】驾驭未来,随车应“变”:一种融入驾驶风格感知的两阶段
【论文导读】驾驭未来,随车应“变”:一种融入驾驶风格感知的两阶段转载 2024-05-24 21:12:44 · 70 阅读 · 0 评论 -
【论文解析】笔触渲染生成 前沿工作梳理
最近的一些工作梳理2023年 Stroke-based Neural Painting and Stylization with Dynamically Predicted Painting Region2022年Im2Oil: Stroke-Based Oil Painting Rendering with Linearly Controllable Fineness Via Adaptive Sampling。原创 2024-04-24 19:24:43 · 688 阅读 · 0 评论 -
【讲座分享】| 复旦大学张奇教授——《自然语言发表论文如何打怪升级?NLP顶会论文发表》
两个都可以相当于是把Abstract的每一句话变成一段话详细阐述,中间加上现有的方法有哪些(最好分一下类)现有方法有什么问题最后阐明自己的Contribution贡献,1,2,3分条列出来一般在第一页右上部分加一个图说明自己的motivation不要一上来就描述你的工作,可以先介绍背景知识(往往就是baseline)• 有利于降低初学者或其他领域学者的理解难度• 有利于对introduction中的论文做更详细的解释• 有利于对比baseline和你的方法。原创 2024-01-30 20:57:27 · 1666 阅读 · 1 评论 -
大模型时代下做科研的四个思路
核心就是通过大模型参数冻住,然后微调或加入我们自己的模块达到更好的效果原创 2023-10-06 15:38:36 · 114 阅读 · 0 评论 -
CLIP | 打破文本图像次元壁
CLIP是文字图片的多模态工作CLIP的迁移效果非常好。不同风格数据集的ZeroShot推理能力超强在分类 ,物体检测和分割,视频检索都很多视觉下游任务都可以用CLIP取得有监督学习的效果采用利用自然语音信号的监督信号来进行训练提出了高质量的文本图片对数据集输入是文字和图片的一个配对CLIP包括两个模型:Text Encoder和Image Encoder,其中Text Encoder用来提取文本的特征,可以采用NLP中常用的text transformer模型;而Image Encoder用来提取图像的特原创 2023-09-09 14:54:35 · 998 阅读 · 0 评论 -
MAE 论文精读 | 在CV领域自监督的Bert思想
之前我们了解了VIT和transformerMAE 是基于VIT的,不过像BERT探索了自监督学习在NLP领域的transformer架构的应用,MAE探索了自监督学习在CV的transformer的应用论文标题中的Auto就是说标号来自于图片本身,暗示了这种无监督的学习。原创 2023-08-25 12:23:26 · 991 阅读 · 0 评论 -
VIT 论文精读 | transformer架构引入CV的开创性工作
VIT是基于transformer的在图像分类大放异彩的变体,transformer是VIT的亲爹,可以和resnet相媲美VIT指出混合卷积网络是不必要的,纯transformer的结构也可以在图像分类里面取得特别好的结果开启了一个新的天地原创 2023-08-24 23:02:54 · 312 阅读 · 0 评论 -
GAN | 论文精读 Generative Adversarial Nets
提出一个GAN。原创 2023-08-23 21:00:38 · 507 阅读 · 0 评论 -
经典奠基作 | Bert 论文阅读
实际就是通过带掩码的语言模型来实现,我们其实对这个不陌生,大家在中考高考的时候,做了很多英语的完形填空测试,这实际就是Bert的思想,没想到吧,完形填空蕴藏大智慧。在传统的transformer里面呢,输入是一个句子对,分别给编码器和解码器,但是在当下的Bert里面呢,只有一个编码器,但是也可以输入一个句子对,具体怎么做呢。其实之前是有GPT系列,GPT系列是知道现在的句子预测下一个句子之类的,但这样就意味着是一种单向的信息,知道已有的一些句子,推测未来的句子。一个句子中15%的词做Mask处理。原创 2023-08-04 18:33:03 · 75 阅读 · 0 评论 -
Read Paper | 3D 人体姿态估计-1 | 8月2日-8月4日
读论文系列第一弹原创 2023-08-04 17:14:28 · 144 阅读 · 0 评论