论文笔记(未完待续)—Training deep quantum neural networks

最新推荐文章于 2024-07-18 20:01:18 发布

Kulina5788

最新推荐文章于 2024-07-18 20:01:18 发布

阅读量508

点赞数 2

分类专栏：论文笔记文章标签：神经网络机器学习深度学习

本文链接：https://blog.csdn.net/weixin_34722089/article/details/106582892

版权

论文笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

文章目录

论文概论

这片论文对比经典的神经网络，提出了一种全新的量子神经网络，包括量子感知器(类似经典深度学习中的神经元)，神经网络的损失函数(以量子保真度模拟)，还有基于前两者的量子神经网络前馈算法和反向传播算法。
该网络的输入和输出都是量子态，论文里用生成的量子态对网络模型进行了测试，显示出了不错的网络性能。
论文里对整个网络都进行了公式推导，需要一定的量子计算基础才能看懂。

公式分析

以经典的深度学习网络为例，一个完整的网络需要定义好它的网络结构、配合上它的输入、输出，这就可以看作是他的前向传播了。
然后是网络的损失函数，这可以用来评估网络的性能。
然后是网络的关键，反向传播，或者说是更新网络中的参数矩阵的部分。这一部分在也是论文里最复杂的地方了。

网络中的数据形式

网络的训练数据

论文里的量子神经网络的训练数据是由量子比特的状态。
$\big[ [\text{state}_1,\, \text{unitary} \cdot \text{state}_1], \dots , [\text{state}_N,\, \text{unitary} \cdot \text{state}_N] \big]$
而其中的 $\text{state}$ 和 $\text{unitary} \cdot \text{state}$ 都是以右矢(列向量)的形式存在：
$|{\phi^{in}}>，|{\phi^{out}}>｝$

网络的输入和输出

虽然网络的训练数据都是右矢的形式，但是网络的初始输入需要求出它对应的密度矩阵，也就是：
$\rho^{in}=|{\phi^{in}}><{\phi^{in}}|$
其中， $\rho^{in}$ 就是网络的初始输入。然后：
$X^{in}=\rho^{in}\otimes |0...0>_l<0...0|$
$\rho^{l}=\xi^{l-1}(...\xi^3(\xi^2(\xi^1(X^{in}))))$
公式里的 $\rho^{l}$ 即是每层的输出，也是对应的下一层的输入。一直到网络的最后输出 $\rho^{out}$ 。

网络的前向传播

网络的整个前向传播，就在 $\xi^l$ 中，其中 $l$ 是指网络第 $l$ 层的操作，整个 $\xi$ 的操作就是：
$\xi_s^l(X^{l-1}) = \text{tr}_{l-1}\bigg( U^l(s) \ \big( X^{l-1} \otimes |0...0>_l<0...0| \big)) \ U^l(s)^{\dag} \bigg)$
其中:

s:表示的是循环次数
$\text{tr}_{l-1}$ :是对当前的复合系统(量子计算里面的一个概念)进行求偏迹(partial trace)操作
$\ U^l=U^l_{ml}...U^l_{1}$ ;代表了当前第 $l$ 层的所有量子神经元。其中 $m l$ 是当前 $l$ 层的量子神经元个数
$\ U^l(s)^{\dag}$ 是 $U^l$ 的厄米特共轭矩阵。将一矩阵A的行与列互换，并取各矩阵元素的共轭复数，得一新矩阵，称为厄米特共轭
$0...0>_l<0...0|$ 是一个只有第一行第一列的元素为1，其余元素全为0的矩阵。

网络的损失函数

网络的损失函数是以量子保真度定义的，而且是用的对量子纯态的保真度计算。
$\frac{1}{N} \sum_{x = 1}^N<\phi_x^{out}|\rho_x^{out}(s)|\phi_x^{out}>$
其中 $N$ 是训练数据的数目。

网络的反向传播

网络的反向传播就是更新网络的参数矩阵的过程： $U^l_j\rightarrow e^{i\epsilon K^l_j}U^l_j$
其中：

$i$ ：暂时我也没有弄明白
$\epsilon$ :类比经典的深度神经网络，是更新的步长
而这里的关键，就是如何计算 $K^l_j$ :
$K_j^l(s) = \frac{2^{n_{a_1, \dots, \beta}} \, i}{2 N \lambda} \sum_x \text{tr}_\text{rest} M_j^l(s)$
$M_j^l(s) = \big[A_j^l(s), B_j^l(s) \big]$
$A_j^l(s)= U_j^l(s) \dots U_1^l(s) \, \big( \rho_x^{l-1}(s) \otimes|0...0>_l<0...0| \ \big) \, U_1^l(s)^{\dag} \dots U_j^l(s)^{\dag}$
$B_j^l(s) = U_{j+1}^l(s)^{\dag} \dots U_{m_l}^l(s)^{\dag} \, \big( \mathbb{1}_l \otimes \sigma_x^l(s) \big) \, U_{m_l}^l(s) \dots U_{j+1}^l(s)$
$\sigma_x^l(s) = \mathcal{F}_s^{l+1} \big( \dots \mathcal{F}_s^{out} \big( |\phi_x^{out}><\phi_x^{out}| \big) \dots \big)$
$\mathcal{F}_s^l(X^{l}) = \text{tr}_{l}\bigg( \big( \mathbb{1}_{l-1} \otimes |0...0>_l<0...0| \big) \ U^{l}(s)^{\dag} \ \big( \mathbb{1}_{l-1} \otimes X^l \big) \ U^l(s) \bigg) \\ = \text{tr}_{l}\bigg( \big( \mathbb{1}_{l-1} \otimes \|0...0>_l<0...0| \big) \ U_1^l(s)^{\dag} \dots U_{m_l}^l(s)^{\dag} \ \big( \mathbb{1}_{l-1} \otimes X^l \big) \ U_{m_l}^l(s) \dots U_1^l(s) \bigg)$

代码实现

Kulina5788

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
论文笔记(未完待续)—Training deep quantum neural networks

文章目录论文概论公式分析网络中的数据形式网络的训练数据网络的输入和输出网络的前向传播网络的损失函数网络的反向传播代码实现论文概论这片论文对比经典的神经网络，提出了一种全新的量子神经网络，包括量子感知器(类似经典深度学习中的神经元)，神经网络的损失函数(以量子保真度模拟)，还有基于前两者的量子神经网络前馈算法和反向传播算法。该网络的输入和输出都是量子态，论文里用生成的量子态对网络模型进行了测试，显示出了不错的网络性能。论文里对整个网络都进行了公式推导，需要一定的量子计算基础才能看懂。公式
复制链接

扫一扫