venZQ
码龄5年
关注
提问 私信
  • 博客:7,014
    社区:35
    7,049
    总访问量
  • 7
    原创
  • 299,362
    排名
  • 53
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2019-12-29
博客简介:

weixin_46112284的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    3
    当前总分
    235
    当月
    0
个人成就
  • 获得70次点赞
  • 内容获得5次评论
  • 获得80次收藏
创作历程
  • 3篇
    2024年
  • 3篇
    2023年
  • 1篇
    2022年
成就勋章
兴趣领域 设置
  • 移动开发
    android studio
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Sora训练与AI短片生成——Datawhale AI视频生成学习3

的方式,生成较好的视频描述。
原创
发布博客 2024.03.14 ·
1042 阅读 ·
20 点赞 ·
0 评论 ·
19 收藏

Transformer + SD解析与实战——Datawhale AI视频生成学习2

图像通过编码器(Encoder)处理,生成一个压缩后的表示形式,称为latent表示,其空间维度被压缩为32x32x4。对于encoder和decoder的不同attention,处理的方式可能会不一样。对于encoder来说,不需要mask,可以看到所有的token,而Decoder是自回归,需要mask。页面体验:https://modelscope.cn/studios/iic/scepter_studio/summary。GAN在人脸上比较好,但是不稳定,模式坍塌,窄分布的效果很好(人脸、人体)。
原创
发布博客 2024.03.10 ·
1135 阅读 ·
16 点赞 ·
1 评论 ·
23 收藏

Sora技术路径解读

这里的Encoder根据openai的资料来看可能是一个Video transformer,把输入的视频划分成若干个tuplet,每个tuplet会变成一个token,经过spatial temperal attention进行空间和时间建模获得有效的视频表征token,即上面灰色block部分。使用的encoder参考了Vivit的encoder,这里面提出了3种方式构建时空融合,但是3种方式的效果其实差不多,所以说具体用了哪一种我也不太清楚。sora使用DALLE3对图片打标签,对文本的理解能力强。
原创
发布博客 2024.02.29 ·
878 阅读 ·
24 点赞 ·
0 评论 ·
21 收藏

Open-Vocabulary Multi-Label Classification via Multi-modal Knowledge Transfer 论文解读

Open-Vocabulary Multi-Label Classification via Multi-modal Knowledge Transfer 论文解读
原创
发布博客 2023.02.28 ·
1802 阅读 ·
5 点赞 ·
3 评论 ·
11 收藏

Zero-Shot Out-of-Distribution Detection Based on the Pre-trained Model CLIP 论文解读

Zero-Shot Out-of-Distribution Detection Based on the Pre-trained Model CLIP 论文解读
原创
发布博客 2023.02.17 ·
684 阅读 ·
3 点赞 ·
0 评论 ·
1 收藏

A Survey of Zero-Shot Learning: Settings, Methods, and Applications 论文解读

A Survey of Zero-Shot Learning: Settings, Methods, and Applications 论文解读
原创
发布博客 2023.02.16 ·
228 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

2022计算机保研经历

中等985院校计算机类专业保研经验分享
原创
发布博客 2022.10.19 ·
1238 阅读 ·
2 点赞 ·
1 评论 ·
6 收藏