顾险峰老师2023年计算共形几何暑期课程学习笔记4
最优传输映射
将曲面通过保角变换映射到单位圆盘上,圆盘上有个新的测度。圆盘本身有些测度、均匀分布。找一个圆盘到自身的自映射,如把局部放大或缩小,把第一个测度映射到第二个测度,有无穷多的映射。找一个总代价最小者叫最优传输映射。
如:将弥勒佛映射到二维圆盘上,在圆盘上打均匀分布的点,映射回去这些点便不在是均匀分布,这个映射破坏了初始的概率分布。(流形上不满足均匀分布了)
而经过最优传输映射之后,放回去也是均匀分布
实现了降维,从高维映射到隐空间,从左到右是编码,映射保持概率测度不变
总代价:两点之间的测地距离
Sora 几何解释
左边:大视觉模型
初始空间为图像空间(数据分布),由VAE转化为隐空间(概率分布),由扩散模型将隐空间转为高斯噪音(每个隐向量变为高斯图像,所有的高斯图像构成白噪声空间)
右边:大语言模型
初始空间为文本空间
这四个主空间都有一个对偶空间(token space),将主空间数据切成小块(token),一个图像看作一个token序列,所有这些序列组成的空间为token space。主空间直接没有直接映射但是token space之间存在映射。
sora:三条线(红)(不确定)
映射有无穷多种,
初始粒子与最终粒子可逆
离散逼近:当前粒子位置加上高斯分布(随机方向)
离散逼近:当前粒子位置加上高斯分布(随机方向)