计算共形几何学习笔记四-最优传输映射与sora的几何解释

顾险峰老师2023年计算共形几何暑期课程学习笔记4

最优传输映射

在这里插入图片描述

将曲面通过保角变换映射到单位圆盘上,圆盘上有个新的测度。圆盘本身有些测度、均匀分布。找一个圆盘到自身的自映射,如把局部放大或缩小,把第一个测度映射到第二个测度,有无穷多的映射。找一个总代价最小者叫最优传输映射。
在这里插入图片描述

如:将弥勒佛映射到二维圆盘上,在圆盘上打均匀分布的点,映射回去这些点便不在是均匀分布,这个映射破坏了初始的概率分布。(流形上不满足均匀分布了)

在这里插入图片描述

而经过最优传输映射之后,放回去也是均匀分布

实现了降维,从高维映射到隐空间,从左到右是编码,映射保持概率测度不变

总代价:两点之间的测地距离

Sora 几何解释

在这里插入图片描述

在这里插入图片描述

左边:大视觉模型

初始空间为图像空间(数据分布),由VAE转化为隐空间(概率分布),由扩散模型将隐空间转为高斯噪音(每个隐向量变为高斯图像,所有的高斯图像构成白噪声空间)

右边:大语言模型

初始空间为文本空间

这四个主空间都有一个对偶空间(token space),将主空间数据切成小块(token),一个图像看作一个token序列,所有这些序列组成的空间为token space。主空间直接没有直接映射但是token space之间存在映射。

sora:三条线(红)(不确定)

在这里插入图片描述

映射有无穷多种,
在这里插入图片描述

初始粒子与最终粒子可逆

离散逼近:当前粒子位置加上高斯分布(随机方向)

在这里插入图片描述

离散逼近:当前粒子位置加上高斯分布(随机方向)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值