自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 VideoComposer阅读笔记【视频生成控制】

组合条件控制视频生成,基于diffusion。

2024-02-06 18:30:00 929

原创 JourneyDB数据集简介

数据集有什么:包括4,429,295 张高分辨率的 Midjourney 图像,并附有相应的prompt、caption和visual question answering。: 模型的任务是根据风格属性识别和检索相似的生成图像。该任务评估模型在识别生成图像中微妙的风格细微差别方面的熟练程度。该任务评估模型使用自然语言有效理解和表达生成内容的视觉元素的能力。此任务评估模型理解视觉和风格内容并根据所提供的问题提供相关响应的能力。此任务用于破译原始提示或描述,评估模型理解生成图像的内容和风格的能力。

2024-02-05 16:47:02 853

原创 W.A.L.T阅读笔记【文生视频模型】

李飞飞组,文生视频工作

2024-01-25 18:30:00 2097

原创 CogView阅读笔记【文生图模型】

文生图模型CogView阅读笔记

2024-01-25 11:42:24 506

原创 DrivingGaussian阅读笔记

DrivingGaussian阅读笔记

2024-01-24 19:22:39 986

原创 CogVideo阅读笔记

CogVideo

2024-01-12 14:55:35 684

原创 图像质量评价指标记录(PSNR,LPIPS,SSIM,MS-SSIM)

【代码】图像质量评价指标记录(PSNR,LPIPS,SSIM,MS-SSIM)

2024-01-04 16:36:09 1019

原创 InternVid数据集的下载指南

InternVid数据集下载

2024-01-02 15:01:54 982 1

原创 3DGaussian Splatting阅读笔记

3D Gaussian Splatting阅读笔记

2023-12-30 22:27:14 2032

原创 3D gaussian splatting从零开始实验记录

记录了从零开始跑一遍3dgs实验的所有流程和细节。

2023-12-28 19:16:53 3613 2

原创 谷歌Gemini的API使用记录

Gemini目前提供2个模型:Gemini-pro和Gemini-pro-vision,一个是text2text,一个是vision2text。打印模型名称。

2023-12-25 17:11:22 667

原创 DriveLM阅读笔记

DriveLM

2023-12-13 17:32:34 228

原创 Reason2Drive阅读笔记

Reason2Drive数据集

2023-12-13 15:39:32 94

原创 OPENAI chatgpt API的使用指南

最近刚接触GPT的API,将一些使用流程记录下来。

2023-12-08 22:31:03 855

原创 git常用命令行

git常用的命令行

2023-11-24 11:46:00 27

原创 pycharm远程debug总跳转remote_sources解决办法

解决pycharm远程debug总跳转remote sources里的办法

2023-11-17 15:18:52 633 1

原创 多张图片合成视频python代码

【代码】多张图片合成视频python代码。

2023-10-19 16:31:03 203

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除