有效压缩量子数据的量子自动编码器——Quantum autoencoders for efficient compression of quantum data论文翻译

论文地址:
https://arxiv.org/pdf/1612.02806.pdf

论文下载:https://download.csdn.net/download/zbp_12138/15687121

  经典的自动编码器是神经网络,可以学习高维空间中数据的有效低维表示。给定输入 x x x,自动编码器的任务是将 x x x映射到较低维度点 y y y,以便可以从 y y y中恢复 x x x。可以选择基础自动编码器网络的结构,以较小的尺寸表示数据,从而有效地压缩输入。受此想法的启发,我们介绍了一种量子自动编码器的模型,以对量子数据执行类似的任务。训练量子自动编码器以压缩特定的量子态数据集,而经典的压缩算法则无法使用。量子自动编码器的参数使用经典的优化算法进行训练。我们展示了一个简单的可编程电路的示例,该电路可以被训练为高效的自动编码器。我们在量子模拟的背景下应用我们的模型来压缩哈伯德模型和分子哈密顿量的基态。

一、导言

  量子技术,从量子计算到量子密码学,已经被发现在现代社会有越来越强大的应用。例如,用于化学的量子模拟器最近被证明能够有效地计算小系统的分子能量[1];大尺度模拟的能力有望对材料设计、药理学研究和一系列其他可能改变生命的功能产生深远影响[2]。然而,几乎所有这些应用的一个限制因素是在实验中可以实现的量子资源的数量。因此,对于现在和不久的将来的实验来说,任何能够减少这些资源的实验开销的工具都是特别有价值的。

  对于经典的数据处理,通过自动编码器的机器学习是一种用于降维的工具[3–5],并且在生成数据模型中有应用[6]。经典的自动编码器是一个函数,它的参数在给定(n+k)位输入字符串x的情况下,在训练数据集中进行优化,试图再现x。然而,电路规范的一部分是在这个过程中删除一些k位。如果一个自动编码器被成功地训练成在输出端至少大约再现x,那么紧接着擦除之后的剩余n位(称为潜在空间)表示字符串x的压缩编码。因此,电路“学习”编码接近训练集的信息。

  在本文中,我们介绍了一个量子自动编码器的概念,它的设计灵感来自于n+k量子比特的输入。因为量子力学能够产生具有超越经典物理的特性(例如叠加和纠缠)的模式,量子计算机也应该能够识别出超越经典机器学习能力的模式。因此,量子自动编码器的动机很简单;这样一个模型允许我们为量子系统执行类似的机器学习任务,而不需要昂贵的经典内存,例如,在量子数据的降维方面。提出量子自动编码器模型的相关工作建立了经典和量子前馈神经网络之间的形式联系,其中量子网络中的特定参数设置精确地简化为经典神经网络[7]。在这项工作中,我们提供了一个更简单的模型,我们相信它更容易捕捉到自动编码器的本质,并将其应用于哈伯德模型和分子哈密顿量的基态。

二、量子自动编码器模型

  与经典自编码器模型类似,量子网络具有一个由一组相互连接的节点组成的图形表示。在量子网络的图中,每个节点表示一个量子比特,网络的第一层表示输入寄存器,最后一层表示输出寄存器。在我们的表示中,连接相邻层的边表示从一个层到下一层的酉变换。特别是,自动编码器缩小第一层和第二层之间的空间,如图1a所示。

  对于一个包含自动编码网络的量子电路来说,在初始“编码器”E之后,一些输入节点中包含的信息必须被丢弃。我们想象这是通过跟踪代表这些节点的量子比特来实现的(在图1b中,这是通过对这些量子比特的测量来表示的)。然后准备新的量子位(初始化到某个参考状态)并用于实现最终的“解码器”D来复原,然后将其结果与初始状态进行比较。

在这里插入图片描述

图1 a) 具有3位潜在空间的6位自动编码器的图形表示。解码器E将6位输入(红点)编码为3位中间状态(黄点),之后解码器D尝试在输出(绿点)处重构输入位。b) 6-3-6量子自动编码器的电路实现。

  量子自动编码器的学习任务是通过较小的中间潜伏期空间来寻找保持输入量子信息的单元。为此,重要的是量化从初始输入状态 ∣ ψ i ⟩ \lvert {\psi}_i\rangle ψi到输出 ρ i o u t {ρ^{out}_i} ρiout的偏差。这里,我们将使用预期的保真度[8] F ( ∣ ψ i ⟩ , ρ i o u t ) = ⟨ ψ i ∣ ρ i o u t ∣ ψ i ⟩ F(\lvert {\psi}_i\rangle, {ρ^{out}_i})=\langle{\psi}_i\lvert {ρ^{out}_i}\lvert {\psi}_i\rangle F(ψi,ρiout)=ψiρioutψi。因此,我们描述了一个成功的自动编码,其中 F ( ∣ ψ i ⟩ , ρ i o u t ) ≈ 1 F(\lvert {\psi}_i\rangle, {ρ^{out}_i})≈1 F(ψi,ρiout)1代表所有的输入状态。

  量子自动编码器更正式的描述如下:设 { p i , ∣ ψ i ⟩ A B } \{pi,\lvert {\psi}_i\rangle_{AB}\} {piψiAB}是 n+k 量子位上纯态的集合,其中子系统A和B分别由n和k量子位组成。设 { U p ⃗ } \{U^{\vec{p}}\} {Up }是作用于n+k量子位的酉算子族,其中 p ⃗ = { p 1 , p 2 , . . . } \vec{p}=\{p_1, p_2, ...\} p ={p1,p2,...}是定义单一量子电路的一组参数。也让| aiB0是k个量子位的某个固定纯参考态。利用经典学习方法,我们希望找到使平均保真度最大的酉 U p ⃗ {U^{\vec{p}}} Up ,我们定义它为代价函数,

C 1 ( p ⃗ ) = ∑ i p i ⋅ F ( ∣ ψ i ⟩ , ρ i , p ⃗ out  ) ( 1 ) C_{1}(\vec{p})=\sum_{i} p_{i} \cdot F\left(\left|\psi_{i}\right\rangle, \rho_{i, \vec{p}}^{\text {out }}\right) (1) C1(p )=ipiF(ψi,ρi,p out )(1)

其中,

ρ i , p ⃗ out  = ( U p ⃗ ) A B ′ † Tr ⁡ B [ U A B p ⃗ [ ψ i A B ⊗ a B ′ ] ( U A B p ⃗ ) † ] ( U p ⃗ ) A B ′ ( 2 ) \rho_{i, \vec{p}}^{\text {out }}=\left(U^{\vec{p}}\right)_{A B^{\prime}}^{\dagger} \operatorname{Tr}_{B}\left[U_{A B}^{\vec{p}}\left[\psi_{i_{A B}} \otimes a_{B^{\prime}}\right]\left(U_{A B}^{\vec{p}}\right)^{\dagger}\right]\left(U^{\vec{p}}\right)_{A B^{\prime}} (2) ρi,p out =(Up )ABTrB[UABp [ψiABaB](UABp )](Up )AB(2)

  我们把 ∣ ψ i ⟩ ⟨ i ψ ∣ A B = ψ i A B {|\psi_{i}\rangle}{\langle_{i}\psi|_{AB}} = {\psi_{i}}_{AB} ψiiψAB=ψiAB ∣ a ⟩ ⟨ a ∣ B ′ = a B ′ {|a\rangle}{\langle a|_{B'}} = a_{B'} aaB=aB缩写。等价地,我们的目标是找到最好的酉矩阵 U p ⃗ {U^{\vec{p}}} Up ,它平均来说,最好地保留了图2中电路的输入状态,在图2中,我们没有在B系统上跟踪,而是在B’系统上使用交换门和跟踪。

在这里插入图片描述
图2 量子自动编码器电路。我们的目标是找到这样的 p ⃗ \vec{p} p 平均 F ( ( ∣ ψ i ⟩ , ρ i , p ⃗ out  ) F(\left(\left|\psi_{i}\right\rangle, \rho_{i, \vec{p}}^{\text {out }}\right) F((ψi,ρi,p out )是最大的。

  为了证明这一点,考虑图2的整个系统的输入和输出的保真度,对于某个固定的 p ⃗ \vec{p} p ,我们用酉矩阵V表示交换操作,

F ( ∣ ψ i ⟩ A B ⊗ ∣ a ⟩ B ′ , U A B † V B B ′ U A B ∣ ψ i ⟩ A B ⊗ ∣ a ⟩ B ′ ) = F ( U A B ∣ ψ i ⟩ A B ⊗ ∣ a ⟩ B ′ , V B B ′ U A B ∣ ψ i ⟩ A B ⊗ ∣ a ⟩ B ′ ) = F ( ∣ ψ i ′ ⟩ A B ⊗ ∣ a ⟩ B ′ , V B B ′ ∣ ψ i ′ ⟩ A B ⊗ ∣ a ⟩ B ′ ) = F ( ∣ ψ i ′ ⟩ A B ⊗ ∣ a ⟩ B ′ , ∣ ψ i ′ ⟩ A B ′ ⊗ ∣ a ⟩ B ) ( 3 ) \begin{array}{l} F\left(\left|\psi_{i}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}}, U_{A B}^{\dagger} V_{B B^{\prime}} U_{A B}\left|\psi_{i}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}}\right)= \\ F\left(U_{A B}\left|\psi_{i}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}}, V_{B B^{\prime}} U_{A B}\left|\psi_{i}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}}\right)= \\ F\left(\left|\psi_{i}^{\prime}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}}, V_{B B^{\prime}}\left|\psi_{i}^{\prime}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}}\right)= \\ F\left(\left|\psi_{i}^{\prime}\right\rangle_{A B} \otimes|a\rangle_{B^{\prime}},\left|\psi_{i}^{\prime}\right\rangle_{A B^{\prime}} \otimes|a\rangle_{B}\right) \end{array} (3) F(ψiABaB,UABVBBUABψiABaB)=F(UABψiABaB,VBBUABψiABaB)=F(ψiABaB,VBBψiABaB)=F(ψiABaB,ψiABaB)(3)

  其中我们表示 U ∣ ψ i ⟩ = ∣ ψ i ′ ⟩ U\left|\psi_{i}\right\rangle = \left|\psi_{i}'\right\rangle Uψi=ψi。成本函数中的项是通过追踪 B ′ B' B系统找到的,

F ( Tr ⁡ B ′ [ ψ i A B ′ ⊗ a B ′ ] , Tr ⁡ B ′ [ ψ i A B ′ ′ ⊗ a B ] ) = F ( ψ i A B ′ , ρ A ′ ⊗ a B ) ( 4 ) \begin{array}{l} F\left(\operatorname{Tr}_{B^{\prime}}\left[\psi_{i_{A B}}^{\prime} \otimes a_{B}^{\prime}\right], \operatorname{Tr}_{B^{\prime}}\left[\psi_{i_{A B^{\prime}}}^{\prime} \otimes a_{B}\right]\right)= \\ F\left(\psi_{i_{A B}}^{\prime}, \rho_{A}^{\prime} \otimes a_{B}\right) \end{array} (4) F(TrB[ψiABaB],TrB[ψiABaB])=F(ψiAB,ρAaB)(4)

  式中 ρ A ′ = Tr ⁡ B ′ ∣ ψ i ′ ⟩ ⟨ ψ i ′ ∣ A B ′ ] \rho_{A}^{\prime}=\operatorname{Tr}_{B^{\prime}}\left|\psi_{i}^{\prime}\right\rangle\left\langle\left.\psi_{i}^{\prime}\right|_{A B^{\prime}}\right] ρA=TrBψiψiAB]。但是,考虑通过AB系统进行追踪,并查看 B ′ B' B的“垃圾系统”,

F ( Tr ⁡ A B [ ψ i A B ′ ⊗ a B ′ ] , Tr ⁡ A B [ ψ i A B ′ ′ ⊗ a B ] ) = F ( ∣ a ⟩ B ′ , ρ B ′ ′ ) ( 5 ) \begin{array}{l} F\left(\operatorname{Tr}_{A B}\left[\psi_{i_{A B}}^{\prime} \otimes a_{B}^{\prime}\right], \operatorname{Tr}_{A B}\left[\psi_{i_{A B^{\prime}}}^{\prime} \otimes a_{B}\right]\right)= \\ F\left(|a\rangle_{B^{\prime}}, \rho_{B^{\prime}}^{\prime}\right) \end{array} (5) F(TrAB[ψiABaB],TrAB[ψiABaB])=F(aB,ρB)(5)

  式中 ρ B ′ ′ = Tr ⁡ A ′ ∣ ψ i ′ ⟩ ⟨ ψ i ′ ∣ A B ′ ] \rho_{B'}^{\prime}=\operatorname{Tr}_{A^{\prime}}\left|\psi_{i}^{\prime}\right\rangle\left\langle\left.\psi_{i}^{\prime}\right|_{A B^{\prime}}\right] ρB=TrAψiψiAB]。此后,我们将 ρ B ′ ′ \rho_{B'}^{\prime} ρB称为电路的“垃圾状态”。在上面的电路中很容易看出,完全保真度(即 C 1 = 1 C_1=1 C1=1)可以通过酉矩阵U实现,当且仅当,对于所有i:

U ∣ ψ i ⟩ A B = ∣ ψ i c ⟩ A ⊗ ∣ a ⟩ B ( 6 ) U\left|\psi_{i}\right\rangle_{A B}=\left|\psi_{i}^{c}\right\rangle_{A} \otimes|a\rangle_{B} (6) UψiAB=ψicAaB(6)

  其中 ∣ ψ i c ⟩ A \left|\psi_{i}^{c}\right\rangle_{A} ψicA ∣ ψ i ⟩ \left|\psi_{i}\right\rangle ψi的压缩形式。这是因为,如果在交换发生时 B B B B ′ B' B系统是相同的,那么整个电路将缩小到同一映射。然而,当垃圾状态与参考状态相等时,即 F ( ∣ a ⟩ B ′ , ρ B ′ ′ ) = 1 F\left(|a\rangle_{B^{\prime}}, \rho_{B^{\prime}}^{\prime}\right)=1 F(aB,ρB)=1,这种情况就会发生。这意味着只有在垃圾状态下进行训练才有可能完成寻找理想 U p ⃗ {U^{\vec{p}}} Up 的学习任务。此外,由于上式完全独立于 U † U^† U,这表明图2的电路可以进一步缩小。然后我们考虑另一种关于垃圾状态保真度的成本函数定义,

C 2 ( p ⃗ ) = ∑ i p i ⋅ F ( Tr ⁡ A [ U p ⃗ ∣ ψ i ⟩ ⟨ ψ i ∣ A B ( U p ⃗ ) † ] , ∣ a ⟩ B ) ( 7 ) C_{2}(\vec{p})=\sum_{i} p_{i} \cdot F\left(\operatorname{Tr}_{A}\left[U^{\vec{p}}\left|\psi_{i}\right\rangle\left\langle\left.\psi_{i}\right|_{A B}\left(U^{\vec{p}}\right)^{\dagger}\right],|a\rangle_{B}\right)\right. (7) C2(p )=ipiF(TrA[Up ψiψiAB(Up )],aB)(7)

  然而,请注意,式(1)和式(7)的成本函数一般不相同(实际上, C 1 ≤ C 2 C_1≤C_2 C1C2)。但是,在实践中,必须考虑资源限制;不难看出,准备固定引用状态的副本要比要求输入状态的相同副本在整个输出状态的交换测试中使用容易得多。对于量子自动编码器的某些应用,也可能是这样的情况,即人们对输入状态的访问有限或知识有限。

  有趣的是,如果我们只关心 C 2 ≈ 1 C_2≈1 C21的电路,我们可以把问题重新想象成寻找一个特殊的解纠缠的问题。已经证明,使用指数深度的电路,总是能够执行解纠缠操作[9],但是在常数或多项式深度中执行此操作是困难的,因此经典的启发式算法通常用于寻找尽可能接近最优的量子电路。此外,在单次压缩和单次解耦的背景下,信息理论界也曾在这方面进行过探索[10,11]。然而,由于选择有效的实现单元族所涉及的启发式算法在很大程度上是临时的,因此很难说这些边界在量子自动编码器的上下文中是否有意义。

三、量子自动编码器模型的实现

  为了在量子计算机上实现量子自动编码器模型,我们必须定义幺正矩阵 U p ⃗ {U^{\vec{p}}} Up (式(2))的形式,并将其分解成适合优化的量子电路。为了有效地实现,电路中的参数数目和门的数目应与输入量子位的数目成多项式比例。这一要求立即消除了使用(n+k)量子位广义幺正矩阵作为 U p ⃗ {U^{\vec{p}}} Up 的可能性,因为生成它们所需的参数数量是指数级的。

  产生 U p ⃗ {U^{\vec{p}}} Up 的一种替代方法是采用可编程量子电路[12,13]。这种电路结构由固定的门网络组成,其中与门相关的多项式数量的参数(即旋转角度)构成p。定义门网络的模式被视为一个单元。理想情况下,可以重复使用该单元以增加模型的灵活性。对于这项工作中提出的数值评估,我们使用了两个简单的可编程电路,如图3所示。

在这里插入图片描述
图3 两个可编程电路用作自动编码器模型:a)电路a:量子比特中所有可能的两个量子比特门(用 U i U_i Ui表示)的网络。b) 电路b:一个网络,由一个量子位集合中所有可能的受控一般单量子位旋转(用 R i R_i Ri表示),加上单元开始和结束时的单量子位旋转组成。所有的电路都是在一个四量子位输入的情况下描述的。单位单元格由红色虚线分隔。

  电路a具有一个单元,包括一个由两个量子比特门构成的网络,其中我们考虑了量子比特之间的所有可能配对,如图3a所示,对于四个量子比特情况。因此,该模型要求每个单元有 15 n ( n − 1 ) / 2 15n(n−1)/2 15nn1/2个训练参数。利用最新的超导量子比特技术[14]和将两个量子门标准分解为三个CNOT门和单量子比特旋转[15],可以轻松实现任意两个量子门网络。任意两个量子门也使用离子阱[16]和量子点[17]实现。

  电路b有一个单位,包括一组量子位中所有可能的受控一个量子位旋转门,在单位单元的开始和结束处用一组单个量子位旋转来补充,如图3b中四个量子位的情况所示。我们开始考虑第一个量子位控制的旋转,然后是第二个量子位控制的旋转,依此类推。因此,我们的第二个模型包括每单位单元 3 n ( n − 1 ) + 6 n 3n(n−1)+6n 3nn1+6n个训练参数,可以在最先进的量子硬件中实现,使用受控单元的标准分解为两个CNOT门和单个量子比特旋转[18]。此模型也是通用的,可以通过向参数添加约束进行修改。例如,可以考虑旋转的初始层和最终层都是相同的。

  一旦选择了电路模型,我们就必须通过最大化自动编码器的代价函数公式(7)来训练网络,类似于经典的自动编码器。我们的训练过程采用量子经典混合方案,在量子计算机上进行状态的制备和测量,而优化则通过在经典计算机上运行的优化算法来实现。这种混合方案是在量子机器学习[19,20]和量子模拟变分算法[21–24]的背景下提出的。在后一种情况下,已经成功地进行了几次实验演示[1,21,25]。

  如第二节所述,量子自动编码器的代价函数被定义为压缩产生的垃圾态和参考态之间的保真度的加权平均值。这些保真度可以通过参考状态和垃圾状态之间的交换测试[26]来测量。相应地,我们的量子寄存器必须包含输入态 ∣ ψ i ⟩ \left|\psi_{i}\right\rangle ψi和参考态。在训练算法的一次迭代中,我们对训练集中的每个状态执行以下步骤:

  1. 准备输入状态 ∣ ψ i ⟩ \left|\psi_{i}\right\rangle ψi和参考状态。我们认为这些准备工作是有效率的。
  2. 在编码酉矩阵 U p ⃗ {U^{\vec{p}}} Up 下演化,其中 p ⃗ {\vec{p}} p 是给定优化步骤的参数集。
  3. 通过交换测试测量垃圾箱状态和参考状态之间的保真度。

  通过对所有置信度的估计,计算代价函数(式(7)),并将其输入经典优化过程,该过程为我们的压缩电路返回一组新的参数。重复这些步骤,直到优化算法收敛。假设代价函数的值的上限为1,我们通过最小化函数 l o g 1 0 ( 1 − C 2 ) log10^{(1−C2)} log101C2的值来执行优化。这一过程广泛应用于机器学习应用中,有助于防止数值不稳定性[27]。用于训练量子自动编码器的混合方案的图形摘要如图4所示。

在这里插入图片描述
图4 量子自动编码器训练混合方案的示意图。在准备好输入状态|ψii之后,应用参数化幺正态 U p ⃗ {U^{\vec{p}}} Up 对状态进行压缩。通过交换测试测量压缩产生的参考状态和垃圾状态之间的重叠。将训练集中所有状态的结果收集起来,用经典的优化算法计算出最小化的代价函数。重复该过程,直到在代价函数和或参数值 p ⃗ = ( p 1 , p 2 , . . . ) \vec{p}=(p_1, p_2, ...) p =(p1,p2,...)上实现收敛。

四、在量子模拟中的应用

  考虑一组状态 { ∣ ψ i ⟩ } \{\left|\psi_{i}\right\rangle\} {ψi},支持希尔伯特空间 S ⊂ H S⊂H SH的子集。使用量子自动编码器,我们可以找到一种只使用 l o g 2 ∣ S ∣ log_2^{| S |} log2S量子位来表示状态的编码方案,而不是使用 l o g 2 ∣ H ∣ log_2^{ | H |} log2H,垃圾状态的大小为 l o g 2 ∣ H − S ∣ log_2^{ | H−S |} log2HS。图5以图形方式描述了这个想法。由于特殊的对称性,多体系统的本征态通常会遇到这种情况。

在这里插入图片描述
图5 希尔伯特空间压缩的图示。假设感兴趣的状态只支持希尔伯特空间的一个子集S(灰色片段),量子自动编码器会找到一个使用大小为 ∣ S ∣ | S | S的空间的编码。

  例如,费米子波函数是粒子数算符的本征函数,与费米子态向量相同。因此,具有η粒子的系统的本征态仅由具有相同粒子数的费米子状态向量的子空间来跨越[28],该子空间的大小为 ( N η ) \left(\begin{array}{l} N \\ \eta \end{array}\right) (Nη),N为费米子模数。这一结果对设计用于模拟的量子算法具有直接的意义,表明如果能找到适当的映射,存储费米子波函数所需的量子比特数可以减少到 log ⁡ ( N η ) \log \left(\begin{array}{l} N \\ \eta \end{array}\right) log(Nη)。自旋投影算符也遇到了同样的情况,从而进一步减小了跨越特定费米子波函数的子空间的大小。

  一般来说,在求多体系统的本征态时,系统的粒子数是输入的一部分。在量子化学模拟中,目标态的自旋投影也是已知的。许多模拟量子系统的经典算法利用这些约束来降低计算成本[28]。然而,用于将费米子系统映射到量子位的标准变换,即Bravyi-Kitaev(BK)和Jordan-Wigner(JW)映射[29,30],没有利用这些对称性,因此使用的量子位比正式需要的要多。

  在这种情况下,可以训练一个量子自动编码器来压缩使用标准变换运行的量子模拟算法获得的费米子波函数。如果需要存储波函数,可以使用通过该程序获得的压缩方案来减少对内存的使用。它还可以节省用于模拟具有相似对称性的系统的量子资源。为了说明这个想法,我们模拟了一个应用于分子波函数的量子自动编码器。在Born-Oppenheimer近似下,非相对论分子哈密顿量可以写成

H = h n u c + ∑ p q h p q a p † a q + 1 2 ∑ p q r s h p q r s a p † a q † a r a s ( 8 ) H=h_{n u c}+\sum_{p q} h_{p q} a_{p}^{\dagger} a_{q}+\frac{1}{2} \sum_{p q r s} h_{p q r s} a_{p}^{\dagger} a_{q}^{\dagger} a_{r} a_{s} (8) H=hnuc+pqhpqapaq+21pqrshpqrsapaqaras(8)

  式中, h n u c h_{n u c} hnuc对应于原子核之间的经典静电斥力,常数 h p q h_{p q} hpq h p q r s h_{p q r s} hpqrs对应于单电子积分和双电子积分。算符 a p † a_{p}^{\dagger} ap a q a_{q} aq在自旋轨道 p p p中产生和湮灭一个电子。应用JW或BK变换后,分子哈密顿量可以表示为 H = ∑ i M c i H i H=\sum_{i}^{M} c_{i} H_{i} H=iMciHi,M标度为 O ( N 4 ) O(N4) ON4。在这种情况下,算符 H i H_i Hi对应于Pauli矩阵的张量积,实系数 c i c_i ci是一电子积分和两电子积分的线性组合。对于一组固定的原子核和一定数量的电子,分子积分和系数 c i c_i ci是分子内坐标 R ⃗ \vec{R} R 的函数。

  例如,考虑STO-6G最小基集中分子氢的哈密顿量[28]。利用JW变换,作用于四个量子位的相应哈密顿量采用一般形式[29]:

H = c 0 I + c 1 ( Z 0 + Z 1 ) + c 2 ( Z 2 + Z 3 ) + c 3 Z 0 Z 1 + c 4 ( Z 0 Z 2 + Z 1 Z 3 ) + c 5 ( Z 1 Z 2 + Z 0 Z 3 ) + c 6 Z 2 Z 3 + c 7 ( Y 0 X 1 X 2 Y 3 − X 0 X 1 Y 2 Y 3 − Y 0 Y 1 X 2 X 3 + X 0 Y 1 Y 2 X 3 ) ( 9 ) \begin{aligned} H &=c_{0} I+c_{1}\left(Z_{0}+Z_{1}\right)+c_{2}\left(Z_{2}+Z_{3}\right)+c_{3} Z_{0} Z_{1}+\\ & c_{4}\left(Z_{0} Z_{2}+Z_{1} Z_{3}\right)+c_{5}\left(Z_{1} Z_{2}+Z_{0} Z_{3}\right)+c_{6} Z_{2} Z_{3} \\ &+c_{7}\left(Y_{0} X_{1} X_{2} Y_{3}-X_{0} X_{1} Y_{2} Y_{3}-Y_{0} Y_{1} X_{2} X_{3}+X_{0} Y_{1} Y_{2} X_{3}\right) \end{aligned} (9) H=c0I+c1(Z0+Z1)+c2(Z2+Z3)+c3Z0Z1+c4(Z0Z2+Z1Z3)+c5(Z1Z2+Z0Z3)+c6Z2Z3+c7(Y0X1X2Y3X0X1Y2Y3Y0Y1X2X3+X0Y1Y2X3)(9)

  在这种情况下,系数 c i c_i ci是核间距r的函数。通过求解不同r值下哈密顿量的薛定谔方程,我们可以得到氢分子的基态能量,并构造势能面(PES),如图6所示。我们期望沿PES的基态波函数保持相同的粒子数和投影自旋对称性,从而使这组态成为一个很好的压缩目标。

在这里插入图片描述
图6 用STO-6G基组计算氢分子的势能面。红点处的基态用作量子自动编码器的训练集。蓝点处的基态用于测试。

  为了说明前面的想法,我们经典地模拟了一个量子自动编码器,以氢分子的六个基态在不同的r, { Ψ ( r i ) } i 6 = 1 \{Ψ(r_i)\}^6_i=1 {Ψri}i6=1作为我们的训练集。在这种情况下,选择所有状态的权重都相等。在实际应用中,我们可以想象基态是通过量子算法获得的,比如量子变分本征解算器[21]。我们训练了图3中描述的电路模型,分别使用 ∣ 0 ⟩ ⊗ 2 {\left|0\right\rangle}^{⊗2} 02 ∣ 0 ⟩ ⊗ 3 {\left|0\right\rangle}^{⊗3} 03作为参考状态,将四个量子位状态的训练集压缩为两个量子位和一个量子位。一旦电路经过训练,我们就在44个基态上对它们进行了测试,这些基态对应于不同于训练集的r值。培训和测试集的选择如图6所示。

在这里插入图片描述
表1给出了任意单个量子比特的旋转。利用从氢分子基态训练的量子自动编码器进行压缩和解压一个周期后的平均保真度(F)误差。我们还报告了解码态能量的错误。(括号内显示最大和最小错误)。6个状态用于训练,44个状态用于测试。这些结果是通过L-BFGS-B优化得到的。

  任意的单量子比特旋转是通过将它们分解成Pauli-Z和Pauli-Y旋转来实现的, R = R z ( θ 1 ) R y ( θ 2 ) R z ( θ 3 ) R=R_z(θ_1)R_y(θ_2)R_z(θ_3) R=Rz(θ1)Ry(θ2)Rz(θ3),忽略全局相位[18]。优化是使用盆地跳跃(BS)算法的SciPy im实现来执行的[33]。我们还采用了具有数值梯度的L-BFGS-B方法[34](步长 h = 1 0 − 8 h=10^{−8} h=108的中心有限差分公式)。在两种电路模型的优化中,参数都被限制在[0,4π]范围内。通过将参数设置为随机选择的值来初始化每个电路的优化。

  表一显示了通过最佳量子自动编码器压缩和解压缩一个周期后获得的保真度和能量的平均误差。我们观察到,这两种电路模型都能够实现编码的高保真度,产生的解码波函数的能量在化学精度范围内接近原始值(1kcal/mol≡1.6×10−3 Hartrees≡43.4 meV)。这种精度要求确保量子化学预测具有足够的质量,可用于估算热化学性质,如反应速率[35]。

  图7展示了量子自动编码器的优化过程。我们比较了两种不同的优化算法,L-BFGS-B和Basin-Hopping。参数是随机初始化的,两种优化都采用相同的猜测。如图7所示,这两种算法都需要相似数量的代价函数求值来达到相似的精度,并且随着函数求值的数量的增加,代价函数与其理想值之间的差异呈现单调减少的趋势。在最先进的架构中实现量子自动编码器可以受益于使用不需要梯度评估的算法,并且对硬件中存在的噪声具有更大的容忍度,例如Basin-Hopping

在这里插入图片描述
图7 训练过程中成本函数与成本函数评估次数的关系图。这个例子对应于一个量子自动编码器,它使用一个具有六个基态的训练集的电路a,将 H 2 H_2 H2的波函数从4个量子位压缩到2个量子位。比较了L-BFGS-B算法和跳池算法的优缺点。

  为了深入了解压缩过程,我们绘制了压缩态的密度矩阵,并将其与图8中三个不同r值的原始态密度矩阵进行了比较。原始输入密度矩阵的稀疏性是由于氢分子哈密顿量的对称性,其特征向量只支持2个计算基态,允许压缩到单个量子比特。虽然量子自动编码器对这两种类型的电路都有很高的保真度,但密度矩阵的结构表明压缩空间的形式以及因此编码单元的形式在两种电路模型之间是不同的。随着r值的变化,输入空间的特征(这里由密度矩阵的元素表示)与压缩空间的特征之间的关系变得明显。

在这里插入图片描述
图8 三个不同的 H 2 H_2 H2压缩测试实例的输入空间和潜在(压缩)空间的可视化,对应于三个不同的键距离r。输入和潜在空间被描述为输入和压缩状态的密度矩阵。字母(A)和(B)表示用于构造编码单元的电路类型。寄存器的大小(以量子位为单位)显示在括号内。从1开始的整数标签表示从 ∣ 00..0 ⟩ {\left|00..0\right\rangle} 00..0 ∣ 11..1 ⟩ {\left|11..1\right\rangle} 11..1

  除了氢分子的例子外,我们还用Hubbard模型和 H 4 H_4 H4分子的基态测试了自动编码压缩方案。我们考虑了在两个支腿阶梯(分别为2×1和2×2格子)中有2位和4位的半填充Hubbard模型。这些系统的哈密顿量由下式给出

H = − t ∑ < i , j > ∑ σ a i , θ † a j , σ + U ∑ i a i , ↑ † a i , ↑ a i , ↓ † a i , ↓ ( 10 ) H=-t \sum_{<i, j>} \sum_{\sigma} a_{i, \theta}^{\dagger} a_{j, \sigma}+U \sum_{i} a_{i, \uparrow}^{\dagger} a_{i, \uparrow} a_{i, \downarrow}^{\dagger} a_{i, \downarrow} (10) H=t<i,j>σai,θaj,σ+Uiai,ai,ai,ai,(10)

  式中, a i , θ † a_{i, \theta}^{\dagger} ai,θ a j , σ a_{j, \sigma} aj,σ分别在 i i i位产生和湮灭自旋为 σ σ σ的电子。第一项中的总和覆盖了所有相互作用的位点,表示为 < i , j > <i,j> <ij>。我们在水平方向使用周期性边界条件,在垂直方向使用开放边界条件。与分子哈密顿量的情况一样,哈伯德哈密顿量可以用JW或BK变换映射到量子比特,每个位点需要两个量子比特。

  我们训练了图3中的两个电路来压缩哈伯德哈密顿量的基态,通过设置t到6个不同的值,这些值在0.9和1.1之间等距分布, U = 2.0 U=2.0 U=2.0。从随机选择的值开始,优化过程重复三次。对于图9中描述的几何结构,同样的程序应用于六个不同键距d值(0.6、1.4、2.2、3.0、3.8和4.6原子单位)下 H 4 H_4 H4系统的基态。

在这里插入图片描述
图9 H 4 H_4 H4分子呈平行构型,氢原子形成矩形。在两个氢分子的键距固定为2个原子单位(a.u.)的情况下,我们得到了该体系在不同d值下的基态。

  表二显示了哈伯德模型和 H 4 H_4 H4系统压缩的最低误差。误差被量化为成本函数的最终值(公式(7))和理想值1之间的差值。回想一下,代价函数对应于训练集中的平均保真度。我们观察到,使用这两种电路类型,两位Hubbard模型的基态可以从4个量子位压缩到3个量子位。然而,只有电路B能够将这些状态从4到2个量子位和4到1个量子位压缩,误差低于 1 0 − 3 10^{−3} 103。当将H4系统的基态从8个量子位压缩到7个量子位时,相同的电路类型获得的误差小于 1 0 − 4 10^{−4} 104。相反,电路A无法获得 H 4 H_4 H4低于 1 0 − 3 10^{−3} 103的误差。在4位Hubbard模型的情况下,这里提出的电路模型都不能获得低于 1 0 − 3 10^{−3} 103的误差。

  上述两种电路模型的性能之间的差异举例说明了用于自动编码器单元的ansatz如何影响自动编码器模型可实现的压缩程度。通过专门为此目的设计的ansatz,可以更容易地实现对特定状态集的压缩。一种形式的酉矩阵,可以作为模板来设计这样的专用ansatzes是由表达式给出的

U ( α ⃗ ) = e − i ∑ i α i H i U(\vec{\alpha})=e^{-i \sum_{i} \alpha_{i} H_{i}} U(α )=eiiαiHi

  其中实数 α i \alpha_{i} αi是优化的参数,项 H i H_{i} Hi是由Pauli矩阵的张量积组成的局部相互作用。公式(11)的实验实现将受益于为量子模拟算法开发的技术[36]。

  最后,我们指出量子自动编码器所能达到的最大无损压缩速率是由训练集上的子空间大小决定的。因此,给定的一组状态可能只允许较小或空的压缩率。例如,考虑一个具有8个费米子模和4个粒子的费米子系统,例如这里研究的半填充4位Hubbard模型或最小基集中的 H 4 H_4 H4分子。仅仅基于粒子数量的限制,这些8量子比特系统就可以压缩到 log ⁡ 2 ( 8 4 ) ≈ 7 \log_2 \left(\begin{array}{l} 8 \\ 4 \end{array}\right)≈7 log2(84)7量子比特。如果存在额外的对称约束,则可以实现超过此点的压缩。一般来说,我们期望费米子系统中的费米子模的数目比粒子的数目大得多,这是很好的压缩候选者。

五、讨论

  我们已经介绍了量子自动编码器的一般模型——通过经典优化增强学习的量子电路并且已经证明它能够学习能够促进量子数据压缩的单一电路,特别是在量子模拟的上下文中。我们设想这个模型可以有其他的应用,比如量子通信的压缩协议,纠错电路,或者直接解决特定的问题。量子自动编码器的一个自然应用是状态准备。一旦一个量子自动编码器被训练来压缩一组特定的状态,解压酉矩阵 U † U^† U就可以用来产生类似于那些最初用于训练的状态。这是通过准备形式为 ∣ Ψ I ⟩ ⊗ ∣ a ⟩ \left|\Psi_{I}\right\rangle \otimes|a\rangle ΨIa的状态并在 U † U^† U下进行演化来实现的,其中 ∣ ψ i ⟩ \left|\psi_{i}\right\rangle ψi具有潜在空间的大小, ∣ a ⟩ \left|a\right\rangle a是用于训练的参考状态。

  作为状态准备工具的自动编码器直接应用于量子变分算法[21–24]。这些算法通过对一个参数化的ansatz制备的量子态进行测量来近似本征态的能量或时间演化。一个量子自动编码器可以训练没有量子位大小的状态,从一个给定的ansatz获得,然后用作如上所述的状态准备工具。由于自动编码器的参数在训练后是固定的,所以变分算法中唯一有效的参数将是那些与潜在空间 ( n l ) (n_l) nl中状态的准备相关的参数。由于 n l < n o n_l<n_o nl<no,使用自动编码器进行状态准备需要的参数比原来的ansatz少。

  在我们的自动编码器规范中,我们将输入态定义为纯态的集合,而这些态的演化是酉的。然而,最广义的自动编码器图像将允许输入是混合态的集合,而集合 { U p ⃗ } \{U^{\vec{p}}\} {Up }是一组量子通道。在混合状态输入的情况下,我们注意到这个公式原则上已经可以被我们的模型捕获。更具体地,可以考虑表示混合状态的净化的辅助集(表示为 A ′ A' A)与原始输入一起被输入到自动编码器的情况。Ulhmann定理[8]保证存在一个净化,其保真度与追踪净化产生的混合态保真度相同;即,它是单一作用于净化的酉V上的最大值(尽管寻找这个酉本身可能是一个困难的计算问题)。然后考虑编码 U A B p ⃗ ⊗ V A ′ U_{A B}^{\vec{p}} \otimes V_{A^{\prime}} UABp VA,其中原始的潜在空间被扩展到包含所有的 A ′ A' A(即没有追踪到任何辅助量子位)。净化后的系统将恢复混合系统的性能。此处定义的自动编码器结构不能完全捕获一般量子信道的结构,尽管我们期望其他计算任务可以通过考虑特定信道实例来解决

  量子自动编码器模型有什么明显的局限性吗?其中一个考虑因素是,代表系综 { p i , ∣ ψ i ⟩ A B } \left\{p_{i},\left|\psi_{i}\right\rangle_{A B}\right\} {pi,ψiAB}的密度算符的von-Neumann熵[8]限制了它可以被无噪声压缩的量子比特数。然而,找到这个密度算符的熵并不是一件小事——事实上,给定一个构造密度算符ρ的电路,我们知道,一般来说,即使估计ρ的熵也是QSZK完备的[37]。这就为量子自动编码器有效地给出密度算符熵的估计提供了可能。类似地,可以将自动编码器的幺正性定义为包括量子信道的动作,并且自动编码器用于给出量子通信信道的编码和容量的一些下界(尽管在某些情况下垃圾状态可能不再用于训练自动编码器)。

  我们很自然地会考虑我们定义的量子自动编码器结构是否是经典结构的推广,如[7]中的构造。为了得到n和k的某些选择,某些特定的酉族可以构造成一个映射。然而,目前尚不清楚这种通信是否可取。相反,我们相信自动编码器的价值一般在于相对简单的结构,即强迫网络将信息保存在较小的子空间中,正如我们在这里定义的那样。

  任何量子计算模型感兴趣的另一个主题是设备所表现出的计算复杂性。对于我们的构造,很明显,任何复杂性结果都将取决于选择用于优化学习的单元族。由于训练本身是基于经典优化算法(没有明确的“最优”学习方法),这进一步混淆了关于模型复杂性的一般陈述。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值