自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 2024年广东继续教育公需课《新质生产力与高质量发展》试题答案及解析

2024年广东省教师继续教育信息管理平台公需课学习新质生产力与高质量发展试题答案及解析

2024-06-14 23:13:34 1406

原创 AI最新进展介绍——文生视频OpenAI Sora

中引入的重配字幕技术应用于视频。我们发现,在高度描述性的视频字幕上进行训练可提高文本的保真度以及视频的整体质量。我们发现,对于在不同类型的视频和图像上训练生成模型来说,补丁是一种高度可扩展且有效的表示方法。在下面的示例中,中间的视频插接在左右两边相应的视频之间。今天所拥有的能力证明,不断扩大视频模型的规模,是开发物理和数字世界以及其中的物体、动物和人的功能模拟器的一条大有可为的道路。这些功能表明,继续扩大视频模型的规模,是开发物理和数字世界以及其中的物体、动物和人的高功能模拟器的一条大有可为的途径。

2024-02-23 22:42:34 888

原创 AI最新进展介绍——大世界模型Large World Model (LWM)

最大上下文大小的神经网络: 我们在长视频和语言序列上训练了一个最大的上下文大小转换器,为困难的检索任务和长视频理解设定了新的基准。克服视觉-语言训练挑战的解决方案,包括使用掩码序列打包混合不同的序列长度、损失加权以平衡语言和视觉,以及模型生成的长序列聊天。可以使用超大的上下文窗口进行各种格式的训练,如视频-文本、文本-视频、图像-文本、文本-图像、纯视频、纯图像和纯文本。在一个包含各种长视频和书籍的大型数据集上进行训练,可以进行语言、图像和视频的理解和生成。的各种形式的视觉内容进行视觉语言训练。

2024-02-22 22:08:17 1223

原创 AI最新进展介绍——LAVE(LLM 驱动的视频编辑代理辅助和语言增强功能)

​。

2024-02-22 18:37:14 220

原创 线性调频变标算法(Chirp Scaling Algorithm)——SAR成像算法MATLAB代码实现

线性调频变标算法(Chirp Scaling Algorithm)

2023-05-08 21:20:20 393 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除