啊呀呀呀!真的学不明白了 o(TωT)o
量子力学基础知识
在 上一篇 博客里整理了一些量子计算的常识性内容。
基本概念
标量积
⟨
B
∣
A
⟩
\langle B|A\rangle
⟨B∣A⟩ 的物理含义:对于态矢
∣
A
⟩
|A\rangle
∣A⟩ 描述的物理系统进行测量,使得它坍缩到状态
∣
B
⟩
|B\rangle
∣B⟩ 的几率幅。假设
∣
i
⟩
|i\rangle
∣i⟩ 是一组基矢,那么有
∣
A
⟩
=
∑
i
⟨
i
∣
A
⟩
⋅
∣
i
⟩
|A\rangle = \sum_i \langle i|A\rangle \cdot |i\rangle
∣A⟩=i∑⟨i∣A⟩⋅∣i⟩
并且满足 ∑ i ∣ ⟨ i ∣ A ⟩ ∣ 2 = 1 \sum_i |\langle i|A\rangle|^2 = 1 ∑i∣⟨i∣A⟩∣2=1。波函数为 Ψ A ( B ) = ⟨ B ∣ A ⟩ \Psi_A(B) = \langle B|A\rangle ΨA(B)=⟨B∣A⟩。标量积是厄米的, ⟨ B ∣ A ⟩ = ⟨ A ∣ B ⟩ † \langle B|A\rangle = \langle A|B\rangle^\dagger ⟨B∣A⟩=⟨A∣B⟩†
对易式 [ A , B ] : = A B − B A [A,B] := AB-BA [A,B]:=AB−BA,反对易式 { A , B } : = A B + B A \{A,B\} := AB+BA {A,B}:=AB+BA
正交归一条件:对于分立谱 ⟨ ξ i ∣ ξ j ⟩ = δ i j \langle\xi_i|\xi_j\rangle=\delta_{ij} ⟨ξi∣ξj⟩=δij,对于连续谱 ⟨ ξ ′ ∣ ξ ′ ′ ⟩ = δ ( ξ ′ − ξ ′ ′ ) \langle\xi'|\xi''\rangle=\delta(\xi'-\xi'') ⟨ξ′∣ξ′′⟩=δ(ξ′−ξ′′),其中的 δ ( ⋅ ) \delta(\cdot) δ(⋅) 是指示函数。
完备条件: ∑ i ∣ ξ i ⟩ ⟨ ξ i ∣ + ∫ ∣ ξ ′ ⟩ d ξ ′ ⟨ ξ ′ ∣ = I \sum_i|\xi_i\rangle\langle\xi_i| + \int|\xi'\rangle d\xi'\langle\xi'| = I ∑i∣ξi⟩⟨ξi∣+∫∣ξ′⟩dξ′⟨ξ′∣=I,如果全是离散的则 ∑ i ∣ ξ i ⟩ ⟨ ξ i ∣ = I \sum_i|\xi_i\rangle\langle\xi_i| = I ∑i∣ξi⟩⟨ξi∣=I
量子测量
测量算子是一个集合
{
M
m
}
\{M_m\}
{Mm},对于系统量子态
∣
ψ
⟩
|\psi\rangle
∣ψ⟩,测量这个系统以概率(注意
M
m
∣
ψ
⟩
M_m|\psi\rangle
Mm∣ψ⟩ 是态矢不是几率幅)
p
(
m
)
=
(
M
m
∣
ψ
⟩
)
†
(
M
m
∣
ψ
⟩
)
=
⟨
ψ
∣
M
m
†
M
m
∣
ψ
⟩
p(m) = (M_m|\psi\rangle)^\dagger (M_m|\psi\rangle) = \langle\psi|M_m^\dagger M_m|\psi\rangle
p(m)=(Mm∣ψ⟩)†(Mm∣ψ⟩)=⟨ψ∣Mm†Mm∣ψ⟩
测得结果
m
m
m,并且系统的测后状态为(除以
p
(
m
)
\sqrt{p(m)}
p(m) 归一化):
∣
ψ
′
⟩
=
M
m
∣
ψ
⟩
p
(
m
)
|\psi'\rangle = \dfrac{M_m|\psi\rangle}{\sqrt{p(m)}}
∣ψ′⟩=p(m)Mm∣ψ⟩
由于 ∑ m p ( m ) = 1 \sum_m p(m)=1 ∑mp(m)=1,因此 ∑ m M m † M m = I \sum_m M_m^\dagger M_m = I ∑mMm†Mm=I,这就是测量算子的完备性条件。
可观测力学量 M M M 是厄米算子,它有谱分解 M = ∑ m m P m M = \sum_m m P_m M=∑mmPm(酉对角化,本征矢是标准正交的),其中 m m m 是本征值,对应的本征态是 ∣ m ⟩ |m\rangle ∣m⟩(满足 ⟨ m ∣ m ⟩ = 1 \langle m|m\rangle=1 ⟨m∣m⟩=1),那么 P m = ∣ m ⟩ ⟨ m ∣ P_m = |m\rangle\langle m| Pm=∣m⟩⟨m∣ 就是到本征子空间的投影算子。
我们以
{
P
m
}
\{P_m\}
{Pm} 作为正交测量算子(即
P
m
P
n
=
δ
m
n
M
m
P_mP_n=\delta_{mn}M_m
PmPn=δmnMm)进行正交投影测量,系统
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 以概率
p
(
m
)
=
⟨
ψ
∣
P
m
∣
ψ
⟩
p(m) = \langle\psi|P_m|\psi\rangle
p(m)=⟨ψ∣Pm∣ψ⟩ 测量出
m
m
m,测后状态为
P
m
∣
ψ
⟩
p
(
m
)
\dfrac{P_m|\psi\rangle}{\sqrt{p(m)}}
p(m)Pm∣ψ⟩,在系统
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 下力学量
M
M
M 的观测平均值为:
⟨
M
⟩
:
=
∑
m
p
(
m
)
⋅
m
=
⟨
ψ
∣
(
∑
m
m
P
m
)
∣
ψ
⟩
=
⟨
ψ
∣
M
∣
ψ
⟩
\langle M \rangle := \sum_m p(m) \cdot m = \langle\psi|\left(\sum_m mP_m\right)|\psi\rangle = \langle\psi|M|\psi\rangle
⟨M⟩:=m∑p(m)⋅m=⟨ψ∣(m∑mPm)∣ψ⟩=⟨ψ∣M∣ψ⟩
广义测量:在大系统上执行正交投影测量时,在子系统上观察到的测量。
对于任意测量
{
M
m
}
\{M_m\}
{Mm},我们记
E
m
=
M
m
†
M
m
E_m = M_m^\dagger M_m
Em=Mm†Mm,它们是正定的厄米算子,并且
{
E
m
}
\{E_m\}
{Em} 是完备的,即
∑
m
E
m
=
I
\sum_m E_m=I
∑mEm=I。我们将
E
m
E_m
Em 叫做 POVM 元,集合
{
E
m
}
\{E_m\}
{Em} 叫做一个 POVM(Positive Operator-Valued Measure)。更一般地,POVM 指的是任意一组完备的正定算符。易知,对于系统
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 的 POVM 的概率分布为:
p
(
m
)
=
⟨
ψ
∣
E
m
∣
ψ
⟩
p(m) = \langle\psi|E_m|\psi\rangle
p(m)=⟨ψ∣Em∣ψ⟩
Neumark 定理:给定任意的 POVM,都可以将态空间扩展到更大态空间,然后在大系统上执行正交投影测量,来实现原始态空间的 POVM。
也就是,在大系统上做正交投影测量,那么在子系统上看来就是 POVM 了。注意,POVM 元并不是测量算子,但它足够确定不同测量结果的概率,此时人们不关心系统的测后状态。
密度算符
给定归一化量子态
∣
ψ
⟩
|\psi\rangle
∣ψ⟩(满足
⟨
ψ
∣
ψ
⟩
=
1
\langle \psi|\psi\rangle=1
⟨ψ∣ψ⟩=1),定义(纯态)密度算符为
ρ
=
∣
ψ
⟩
⟨
ψ
∣
\rho = |\psi\rangle\langle\psi|
ρ=∣ψ⟩⟨ψ∣
容易验证 ρ \rho ρ 是厄米的( ρ † = ρ \rho^\dagger = \rho ρ†=ρ),也是幂等的( ρ 2 = ρ \rho^2 = \rho ρ2=ρ)
它的矩阵元为(注意
n
n
n 量子比特的态矢是
2
n
2^n
2n 维复向量,密度矩阵大小是
2
n
×
2
n
2^n \times 2^n
2n×2n 而非
n
×
n
n \times n
n×n)
ρ
i
j
=
⟨
i
∣
ρ
∣
j
⟩
=
⟨
i
∣
ψ
⟩
⟨
ψ
∣
j
⟩
=
⟨
i
∣
ψ
⟩
⋅
(
⟨
ψ
∣
j
⟩
)
†
\rho_{ij} = \langle i|\rho|j\rangle = \langle i|\psi\rangle\langle\psi|j\rangle = \langle i|\psi\rangle \cdot (\langle\psi|j\rangle)^\dagger
ρij=⟨i∣ρ∣j⟩=⟨i∣ψ⟩⟨ψ∣j⟩=⟨i∣ψ⟩⋅(⟨ψ∣j⟩)†
对角线元素
ρ
i
i
=
∣
⟨
i
∣
ψ
⟩
∣
2
\rho_{ii} = |\langle i|\psi\rangle|^2
ρii=∣⟨i∣ψ⟩∣2 就是测量值为
∣
i
⟩
|i\rangle
∣i⟩ 的概率。因此,它的迹为
t
r
(
ρ
)
=
∑
i
ρ
i
i
=
1
tr(\rho) = \sum_i \rho_{ii} = 1
tr(ρ)=i∑ρii=1
给定力学量
M
M
M,它在量子态
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 下的测量平均值为:
⟨
M
⟩
:
=
⟨
ψ
∣
M
∣
ψ
⟩
=
t
r
(
ρ
M
)
=
t
r
(
M
ρ
)
\langle M \rangle := \langle \psi| M |\psi \rangle = tr(\rho M) = tr(M\rho)
⟨M⟩:=⟨ψ∣M∣ψ⟩=tr(ρM)=tr(Mρ)
以
{
M
m
}
\{M_m\}
{Mm} 作为测量算子,测得结果
m
m
m 的概率为:
p
(
m
)
=
⟨
ψ
∣
M
m
†
M
m
∣
ψ
⟩
=
t
r
(
M
m
†
M
m
ρ
)
p(m) = \langle\psi|M_m^\dagger M_m|\psi\rangle = tr(M_m^\dagger M_m\rho)
p(m)=⟨ψ∣Mm†Mm∣ψ⟩=tr(Mm†Mmρ)
测后状态的密度算符为:
ρ
m
=
M
m
∣
ψ
⟩
⟨
ψ
∣
M
m
†
t
r
(
M
m
†
M
m
ρ
)
=
M
m
ρ
M
m
†
t
r
(
M
m
†
M
m
ρ
)
\rho_m = \dfrac{M_m|\psi\rangle\langle\psi|M_m^\dagger}{tr(M_m^\dagger M_m \rho)} = \dfrac{M_m\rho M_m^\dagger}{tr(M_m^\dagger M_m \rho)}
ρm=tr(Mm†Mmρ)Mm∣ψ⟩⟨ψ∣Mm†=tr(Mm†Mmρ)MmρMm†
混合态:不能用单个波函数描述的状态。一系列的纯态
∣
ψ
k
⟩
|\psi_k\rangle
∣ψk⟩,满足完备性条件
∑
k
∣
ψ
k
⟩
⟨
ψ
k
∣
=
I
\sum_k |\psi_k\rangle\langle \psi_k| = I
∑k∣ψk⟩⟨ψk∣=I,且系统处于状态
∣
ψ
k
⟩
|\psi_k\rangle
∣ψk⟩ 的概率为
p
k
p_k
pk,满足
∑
k
p
k
=
1
\sum_k p_k=1
∑kpk=1,那么系统处于纯态系综
{
p
k
,
∣
ψ
k
⟩
}
\{p_k, |\psi_k\rangle\}
{pk,∣ψk⟩} 的统计混合。此时的密度算符为:
ρ
=
∑
k
p
k
∣
ψ
k
⟩
⟨
ψ
k
∣
=
∑
k
p
k
ρ
k
\rho = \sum_k p_k|\psi_k\rangle\langle\psi_k| = \sum_k p_k\rho_k
ρ=k∑pk∣ψk⟩⟨ψk∣=k∑pkρk
可以证明,混合态的密度算符也是厄米的。但要注意,混合态的密度算符不再幂等,
ρ
2
=
∑
k
p
k
2
∣
ψ
k
⟩
⟨
ψ
k
∣
≠
ρ
,
t
r
(
ρ
2
)
≤
t
r
(
ρ
)
=
∑
k
p
k
⋅
t
r
(
ρ
k
)
=
1
\rho^2 = \sum_k p_k^2 |\psi_k\rangle\langle\psi_k| \neq \rho, \\ tr(\rho^2) \le tr(\rho) = \sum_k p_k \cdot tr(\rho_k) = 1
ρ2=k∑pk2∣ψk⟩⟨ψk∣=ρ,tr(ρ2)≤tr(ρ)=k∑pk⋅tr(ρk)=1
由于密度算子是半正定的厄米阵,因此可以谱分解,
ρ
=
∑
i
λ
i
∣
i
⟩
⟨
i
∣
,
ρ
2
=
∑
i
λ
i
2
∣
i
⟩
⟨
i
∣
,
λ
i
≥
0
,
t
r
(
ρ
)
=
∑
i
λ
i
,
t
r
(
ρ
2
)
=
∑
i
λ
i
2
\rho = \sum_i \lambda_i |i\rangle \langle i|,\,\, \rho^2 = \sum_i \lambda_i^2 |i\rangle \langle i|,\\ \lambda_i \ge 0,\,\, tr(\rho) = \sum_i \lambda_i,\,\, tr(\rho^2) = \sum_i \lambda_i^2
ρ=i∑λi∣i⟩⟨i∣,ρ2=i∑λi2∣i⟩⟨i∣,λi≥0,tr(ρ)=i∑λi,tr(ρ2)=i∑λi2
注意区分 “纯态 & 混合态”(是否可用单个波函数描述)与 “直积态 & 纠缠态”(都是纯态,是否可以写成各个 qubit 的直积形式)。
给定力学量
M
M
M,它在密度算符为
ρ
\rho
ρ 的混合态下,由于迹是线性的,因此它的测量平均值为:
⟨
M
⟩
:
=
∑
k
p
k
⋅
⟨
ψ
k
∣
M
∣
ψ
k
⟩
=
∑
k
p
k
⋅
t
r
(
ρ
k
M
)
=
t
r
(
M
ρ
)
\langle M \rangle := \sum_k p_k \cdot \langle \psi_k| M |\psi_k \rangle = \sum_k p_k \cdot tr(\rho_k M) = tr(M\rho)
⟨M⟩:=k∑pk⋅⟨ψk∣M∣ψk⟩=k∑pk⋅tr(ρkM)=tr(Mρ)
以
{
M
m
}
\{M_m\}
{Mm} 作为测量算子,测得结果
m
m
m 的概率为:
p
(
m
)
=
∑
k
p
k
⋅
⟨
ψ
k
∣
M
m
†
M
m
∣
ψ
k
⟩
=
t
r
(
M
m
†
M
m
ρ
)
p(m) = \sum_k p_k \cdot \langle\psi_k|M_m^\dagger M_m|\psi_k\rangle = tr(M_m^\dagger M_m\rho)
p(m)=k∑pk⋅⟨ψk∣Mm†Mm∣ψk⟩=tr(Mm†Mmρ)
测后状态的密度算符为:
ρ
m
=
∑
k
p
k
M
m
∣
ψ
k
⟩
⟨
ψ
k
∣
M
m
†
t
r
(
M
m
†
M
m
ρ
)
=
M
m
ρ
M
m
†
t
r
(
M
m
†
M
m
ρ
)
\rho_m = \sum_k p_k \dfrac{M_m|\psi_k\rangle\langle\psi_k|M_m^\dagger}{tr(M_m^\dagger M_m \rho)} = \dfrac{M_m\rho M_m^\dagger}{tr(M_m^\dagger M_m \rho)}\\
ρm=k∑pktr(Mm†Mmρ)Mm∣ψk⟩⟨ψk∣Mm†=tr(Mm†Mmρ)MmρMm†
当不知道 m m m 的值,则测后状态只能描述为: ρ ′ = ∑ m p ( m ) ρ m = ∑ m M m ρ M m † \rho' = \sum_m p(m)\rho_m = \sum_m M_m \rho M_m^\dagger ρ′=∑mp(m)ρm=∑mMmρMm†
酉变换
U
U
U 作用在纯态/混合态
ρ
\rho
ρ 上,那么得到
ρ
′
=
∑
k
p
k
(
U
∣
ψ
k
⟩
)
(
U
∣
ψ
k
⟩
)
†
=
U
ρ
U
†
\rho' = \sum_k p_k (U|\psi_k\rangle)(U|\psi_k\rangle)^\dagger = U\rho U^\dagger
ρ′=k∑pk(U∣ψk⟩)(U∣ψk⟩)†=UρU†
一个算子 ρ \rho ρ 是某系综的密度算子,当仅当它满足迹条件( t r ( ρ ) = 1 tr(\rho)=1 tr(ρ)=1)和正定性条件( λ i ≥ 0 \lambda_i \ge 0 λi≥0)。
同一个密度算子可以对应不同的系综。密度算子的酉自由度:两组非归一化的态矢 ∣ ψ i ⟩ , ∣ ϕ j ⟩ |\psi_i\rangle, |\phi_j\rangle ∣ψi⟩,∣ϕj⟩,填充零向量使之有相同大小。那么 ρ = ∑ i ∣ ψ i ⟩ ⟨ ψ i ∣ = ∑ j ∣ ϕ i ⟩ ⟨ ϕ i ∣ \rho = \sum_i|\psi_i\rangle\langle\psi_i| = \sum_j|\phi_i\rangle\langle\phi_i| ρ=∑i∣ψi⟩⟨ψi∣=∑j∣ϕi⟩⟨ϕi∣,当仅当存在酉阵 U U U 使得 ∣ ψ i ⟩ = ∑ j u i j ∣ ϕ j ⟩ |\psi_i\rangle = \sum_j u_{ij} |\phi_j\rangle ∣ψi⟩=∑juij∣ϕj⟩
复合体系
两个系统
A
,
B
A,B
A,B 的基矢为
∣
i
⟩
A
,
∣
j
⟩
B
|i\rangle_A, |j\rangle_B
∣i⟩A,∣j⟩B,则复合系统
A
+
B
A+B
A+B 的一组完备基是
∣
i
⟩
A
⊗
∣
j
⟩
B
|i\rangle_A \otimes |j\rangle_B
∣i⟩A⊗∣j⟩B,其中的纯态可表示为:
∣
ψ
⟩
A
B
=
∑
i
j
a
i
j
∣
i
⟩
A
∣
j
⟩
B
,
∑
i
j
∣
a
i
j
∣
2
=
1
|\psi\rangle_{AB} = \sum_{ij} a_{ij} |i\rangle_A |j\rangle_B,\,\, \sum_{ij} |a_{ij}|^2=1
∣ψ⟩AB=ij∑aij∣i⟩A∣j⟩B,ij∑∣aij∣2=1
如果
A
+
B
A+B
A+B 的状态为
ρ
A
B
\rho^{AB}
ρAB,子系统
B
B
B 的一组基矢
∣
j
⟩
|j\rangle
∣j⟩,那么子系统
A
A
A 的约化密度算子为:
ρ
A
:
=
t
r
B
(
ρ
A
B
)
=
∑
j
⟨
j
∣
ρ
A
B
∣
j
⟩
\rho^A := tr_B(\rho^{AB}) = \sum_j \langle j|\rho^{AB}|j\rangle
ρA:=trB(ρAB)=j∑⟨j∣ρAB∣j⟩
如果
ρ
A
B
=
∣
a
1
⟩
⟨
a
2
∣
⊗
∣
b
1
⟩
⟨
b
2
∣
\rho^{AB} = |a_1\rangle\langle a_2| \otimes |b_1\rangle\langle b_2|
ρAB=∣a1⟩⟨a2∣⊗∣b1⟩⟨b2∣,其中
a
1
,
a
2
a_1,a_2
a1,a2 是子系统
A
A
A 中态矢,
b
1
,
b
2
b_1,b_2
b1,b2 是子系统
B
B
B 中态矢,那么
t
r
B
(
ρ
A
B
)
=
∣
a
1
⟩
⟨
a
2
∣
⋅
t
r
(
∣
b
1
⟩
⟨
b
2
∣
)
=
∣
a
1
⟩
⟨
a
2
∣
⋅
⟨
b
2
∣
b
1
⟩
tr_B(\rho^{AB}) = |a_1\rangle\langle a_2| \cdot tr(|b_1\rangle\langle b_2|) = |a_1\rangle\langle a_2| \cdot \langle b_2|b_1\rangle
trB(ρAB)=∣a1⟩⟨a2∣⋅tr(∣b1⟩⟨b2∣)=∣a1⟩⟨a2∣⋅⟨b2∣b1⟩
约化密度矩阵 ρ A \rho_A ρA 的性质:
- 是厄米的,它的迹为 1 1 1
- 可以酉对角化,本征值是非负实数
- 仅当 ∣ ψ ⟩ = ∣ i ⟩ A ∣ j ⟩ B |\psi\rangle=|i\rangle_A|j\rangle_B ∣ψ⟩=∣i⟩A∣j⟩B 是直积态(两个子系统间非纠缠),才会有 ρ A 2 = ρ A \rho_A^2 = \rho_A ρA2=ρA(纯态)。也就是说,即使复合系统处于纯态,其子系统依然可能处于混合态。
Schmidt 分解:假设
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 是复合系统
A
B
AB
AB 上的纯态,则存在
A
,
B
A, B
A,B 的标准正交基
∣
i
A
⟩
,
∣
i
B
⟩
|i_A\rangle, |i_B\rangle
∣iA⟩,∣iB⟩,使得:
∣
ψ
⟩
=
∑
i
p
i
∣
i
A
⟩
∣
i
B
⟩
|\psi\rangle = \sum_i p_i |i_A\rangle|i_B\rangle
∣ψ⟩=i∑pi∣iA⟩∣iB⟩
其中的 ∣ i ⟩ |i\rangle ∣i⟩ 是复合系统的基矢,它的直积分量 ∣ i A ⟩ , ∣ i B ⟩ |i_A\rangle, |i_B\rangle ∣iA⟩,∣iB⟩ 叫做子系统的 Schmidt 基。其中几率幅 p i ≥ 0 p_i \ge 0 pi≥0 叫做 Schmidt 系数,满足归一化条件 ∑ i p i 2 = 1 \sum_i p_i^2=1 ∑ipi2=1,非零 p i p_i pi 的个数叫做 Schmidt 数。态矢 ∣ ψ ⟩ |\psi\rangle ∣ψ⟩ 是直积态(不纠缠),当仅当 Schmidt 数为 1 1 1,当仅当 ρ A , ρ B \rho^A,\rho^B ρA,ρB 都是纯态。
系统
A
A
A 的任意一个状态为
ρ
A
\rho^A
ρA(纯态/混合态),可以引入另一个系统
R
R
R(非物理的数学技巧),在复合系统
A
+
R
A+R
A+R 中定义某一个纯态
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 使得
ρ
A
=
t
r
R
(
∣
ψ
⟩
⟨
ψ
∣
)
\rho^A = tr_R(|\psi\rangle\langle\psi|)
ρA=trR(∣ψ⟩⟨ψ∣),这个过程称为纯化。此过程中定义的
∣
ψ
⟩
|\psi\rangle
∣ψ⟩ 做 Schimdt 分解后子系统
A
A
A 的 Schmidt 基,就是
ρ
A
\rho^A
ρA 的酉对角化中的基矢,即:
ρ
A
=
∑
i
λ
i
∣
i
A
⟩
⟨
i
A
∣
∣
ψ
⟩
=
∑
i
λ
i
∣
i
A
⟩
∣
i
R
⟩
t
r
R
(
∣
ψ
⟩
⟨
ψ
∣
)
=
∑
i
λ
i
∣
i
A
⟩
⟨
i
A
∣
⋅
t
r
(
∣
i
R
⟩
⟨
i
R
∣
)
\begin{aligned} \rho^A &= \sum_i \lambda_i |i_A\rangle \langle i_A|\\ |\psi\rangle &= \sum_i \sqrt{\lambda_i} |i_A\rangle|i_R\rangle\\ tr_R(|\psi\rangle\langle\psi|) &= \sum_i \lambda_i |i_A\rangle\langle i_A| \cdot tr(|i_R\rangle\langle i_R|) \end{aligned}
ρA∣ψ⟩trR(∣ψ⟩⟨ψ∣)=i∑λi∣iA⟩⟨iA∣=i∑λi∣iA⟩∣iR⟩=i∑λi∣iA⟩⟨iA∣⋅tr(∣iR⟩⟨iR∣)
Bell 不等式
类空间隔:无连接的两个事件。类时间隔:由光束连接的两个事件(物理性影响的传播速度无法超光速)。
E·P·R 在论文中提出了一个思想实验,EPR 佯谬,
- 定域因果观点:类空间隔的两个事件之间无因果关系
- 物理实在要素观点:任意可观测物理量是一个物理实在的要素,在客观上有具体数值,与测量无关(这个在微观世界中不成立)
量子力学的观点:未被观测的粒子并不具有独立于测量的物理性质(物理性质是在系统上执行测量而造成的结果)
著名的 Bell 不等式,
E
(
Q
S
)
+
E
(
R
S
)
+
E
(
R
T
)
−
E
(
Q
T
)
≤
2
E(QS) + E(RS) + E(RT) - E(QT) \le 2
E(QS)+E(RS)+E(RT)−E(QT)≤2
使得可以用实验来检验:到底是爱因斯坦的隐变量是对的,还是量子力学是对的。最终人们发现实验的结果违背了 Bell 不等式,因此实在性假设和定域性假设至少有一个是错的(虽然在直观上它们是那么的合理)。
量子信息论
量子操作
一个闭系统的演化,由酉算子来刻画。而一个开系统,它与外界环境有相互作用,其演化用更加一般化的量子操作来刻画。
主系统
Q
Q
Q 的状态
ρ
\rho
ρ,环境
R
R
R 的状态
ρ
e
n
v
\rho_{env}
ρenv,它们的复合状态是直积态
ρ
⊗
ρ
e
n
v
\rho \otimes \rho_{env}
ρ⊗ρenv。这个复合系统经过酉演化,对环境取偏迹,得到主系统的约化密度算子,其量子操作为:
E
(
ρ
)
=
t
r
e
n
v
(
U
(
ρ
⊗
ρ
e
n
v
)
U
†
)
\mathcal E(\rho) = tr_{env}\left(U(\rho \otimes \rho_{env})U^\dagger\right)
E(ρ)=trenv(U(ρ⊗ρenv)U†)
假设环境
R
R
R 有一组标准正交基
∣
e
k
⟩
|e_k\rangle
∣ek⟩,不失一般性地我们假设
ρ
e
n
v
=
∣
e
0
⟩
⟨
e
0
∣
\rho_{env}=|e_0\rangle\langle e_0|
ρenv=∣e0⟩⟨e0∣,那么有算子和表示,
E
(
ρ
)
=
∑
k
⟨
e
k
∣
U
(
ρ
⊗
ρ
e
n
v
)
U
†
∣
e
k
⟩
=
∑
k
E
k
ρ
E
k
†
\mathcal E(\rho) = \sum_k \langle e_k|U(\rho \otimes \rho_{env})U^\dagger|e_k\rangle = \sum_k E_k \rho E_k^\dagger
E(ρ)=k∑⟨ek∣U(ρ⊗ρenv)U†∣ek⟩=k∑EkρEk†
其中 E k = ⟨ e k ∣ U ∣ e 0 ⟩ E_k=\langle e_k|U|e_0\rangle Ek=⟨ek∣U∣e0⟩ 是主系统 Q Q Q 上的算子,集合 { E k } \{E_k\} {Ek} 叫做操作元。对于输入态 ρ \rho ρ,做量子操作后,以概率 t r ( E k ρ E k † ) tr(E_k \rho E_k^\dagger) tr(EkρEk†) 变为状态 E k ρ E k † t r ( E k ρ E k † ) \dfrac{E_k \rho E_k^\dagger}{tr(E_k \rho E_k^\dagger)} tr(EkρEk†)EkρEk†
通常要求量子操作是保迹的,即:
∀
ρ
,
t
r
(
E
(
ρ
)
)
=
t
r
(
∑
k
E
k
†
E
k
ρ
)
=
1
,
∑
k
E
k
†
E
k
=
I
\forall \rho, tr(\mathcal E(\rho)) = tr(\sum_k E_k^\dagger E_k \rho) =1,\\ \sum_k E_k^\dagger E_k = I
∀ρ,tr(E(ρ))=tr(k∑Ek†Ekρ)=1,k∑Ek†Ek=I
这便是量子操作元的完备性关系。
同一个量子操作的操作元不是唯一的。算子和表示的酉自由度:假设操作元 { E i } \{E_i\} {Ei} 和 { F j } \{F_j\} {Fj} 分别对应量子操作 E , F \mathcal E,\mathcal F E,F,添加零算子使得算子元个数相同。那么 E = F \mathcal E = \mathcal F E=F,当仅当存在酉阵 U U U,使得 E i = ∑ j u i F j E_i=\sum_j u_{i}F_j Ei=∑juiFj
迹距离 & 保真度
如何刻画两个量子态的接近程度呢?在经典信息论中,迹距离定义为 D ( p ( x ) , q ( x ) ) : = 1 2 ∑ x ∣ p ( x ) − q ( x ) ∣ D(p(x),q(x)) := \dfrac{1}{2}\sum_x |p(x)-q(x)| D(p(x),q(x)):=21∑x∣p(x)−q(x)∣(就是分布的统计距离,L1 距离),保真度定义为 F ( p ( x ) , q ( x ) ) : = ∑ x p ( x ) q ( x ) F(p(x),q(x)):= \sum_x \sqrt{p(x)q(x)} F(p(x),q(x)):=∑xp(x)q(x)(几率幅的内积,这不是距离)。
类比着定义量子态的迹距离和保真度,但是使用密度算符替代概率分布。
迹距离
量子态
ρ
,
σ
\rho,\sigma
ρ,σ 的迹距离定义为
D
(
ρ
,
σ
)
:
=
1
2
t
r
∣
ρ
−
σ
∣
=
1
2
t
r
∣
σ
−
ρ
∣
≥
0
D(\rho,\sigma) := \dfrac{1}{2} tr|\rho - \sigma| = \dfrac{1}{2} tr|\sigma - \rho| \ge 0
D(ρ,σ):=21tr∣ρ−σ∣=21tr∣σ−ρ∣≥0
这里的
∣
A
∣
:
=
A
†
A
|A| := \sqrt{A^\dagger A}
∣A∣:=A†A 是奇异值矩阵。对于任意半正定算子
ρ
\rho
ρ 和酉算子
U
U
U,都有
U
ρ
U
†
=
U
ρ
U
†
\sqrt{U\rho U^\dagger}=U\sqrt{\rho}U^\dagger
UρU†=UρU†,于是可以证明迹距离是酉作用不变的,
D
(
U
ρ
U
†
,
U
σ
U
†
)
=
D
(
ρ
,
σ
)
D(U\rho U^\dagger, U\sigma U^\dagger) = D(\rho,\sigma)
D(UρU†,UσU†)=D(ρ,σ)
当
[
ρ
,
σ
]
=
0
[\rho,\sigma]=0
[ρ,σ]=0 对易时,它们可以同时酉对角化
ρ
=
∑
i
r
i
∣
i
⟩
⟨
i
∣
,
σ
=
∑
i
s
i
∣
i
⟩
⟨
i
∣
\rho=\sum_i r_i|i\rangle\langle i|, \sigma=\sum_i s_i|i\rangle\langle i|
ρ=∑iri∣i⟩⟨i∣,σ=∑isi∣i⟩⟨i∣,其中
∣
i
⟩
|i\rangle
∣i⟩ 是同一组标准正交基。此时,量子迹距离退化为经典:
D
(
ρ
,
σ
)
=
1
2
t
r
∣
∑
i
(
r
i
−
s
i
)
∣
i
⟩
⟨
i
∣
∣
=
1
2
∑
i
∣
r
i
−
s
i
∣
=
D
(
r
(
i
)
,
s
(
i
)
)
D(\rho,\sigma) = \dfrac{1}{2} tr\left|\sum_i (r_i-s_i)|i\rangle\langle i|\right| = \dfrac{1}{2} \sum_i |r_i-s_i| = D(r(i),s(i))
D(ρ,σ)=21tr
i∑(ri−si)∣i⟩⟨i∣
=21i∑∣ri−si∣=D(r(i),s(i))
令
σ
⃗
=
(
σ
x
,
σ
y
,
σ
z
)
\vec\sigma=(\sigma_x,\sigma_y,\sigma_z)
σ=(σx,σy,σz) 是泡利矩阵组成的向量,那么存在坐标
r
⃗
,
s
⃗
\vec r, \vec s
r,s 使得
ρ
=
I
+
r
⃗
⋅
σ
⃗
2
\rho = \dfrac{I+\vec r \cdot \vec \sigma}{2}
ρ=2I+r⋅σ,
σ
=
I
+
s
⃗
⋅
σ
⃗
2
\sigma = \dfrac{I+\vec s \cdot \vec \sigma}{2}
σ=2I+s⋅σ,此时有
D
(
ρ
,
σ
)
=
t
r
∣
(
r
⃗
−
s
⃗
)
⋅
σ
⃗
∣
4
D(\rho,\sigma) = \dfrac{tr|(\vec r - \vec s) \cdot \vec \sigma|}{4}
D(ρ,σ)=4tr∣(r−s)⋅σ∣
直接按照迹距离定义,有时由于 ∣ ρ − σ ∣ |\rho-\sigma| ∣ρ−σ∣ 并不太好用。下面给出两个等价的定义,一个使用投影算子,另一个使用 POVM 元。
注意,半正定矩阵的差,不一定还是半正定的,厄米阵的谱分解中本征值可能会小于零。我们令
ρ
−
σ
=
∑
i
d
i
∣
i
⟩
⟨
i
∣
=
Q
−
S
\rho-\sigma = \sum_i d_i|i\rangle\langle i| = Q-S
ρ−σ=∑idi∣i⟩⟨i∣=Q−S,其中
Q
Q
Q 对应非负本征值,
S
S
S 对应负数本征值,且
t
r
(
Q
)
=
t
r
(
S
)
tr(Q)=tr(S)
tr(Q)=tr(S),那么:
D
(
ρ
,
σ
)
=
1
2
t
r
(
Q
+
S
)
=
t
r
(
Q
)
=
max
P
t
r
(
P
(
ρ
−
σ
)
)
D(\rho,\sigma) = \dfrac{1}{2}tr(Q+S) = tr(Q) = \max_P tr(P(\rho-\sigma))
D(ρ,σ)=21tr(Q+S)=tr(Q)=Pmaxtr(P(ρ−σ))
这里的 P P P 是任意投影算子,当它是到子空间 Q Q Q 的投影时取到最大值。
令
{
E
m
}
\{E_m\}
{Em} 是一个 POVM,测得
m
m
m 的几率为
p
m
=
t
r
(
ρ
E
m
)
,
q
m
=
t
r
(
σ
E
m
)
p_m=tr(\rho E_m), q_m=tr(\sigma E_m)
pm=tr(ρEm),qm=tr(σEm),那么:
D
(
ρ
,
σ
)
=
max
{
E
m
}
D
(
p
m
,
q
m
)
D(\rho,\sigma) = \max_{\{E_m\}} D(p_m,q_m)
D(ρ,σ)={Em}maxD(pm,qm)
这里的极大是对于所有的 POVM 取的(确切地说,当选取的 POVM 元包含到子系统 Q Q Q 和 S S S 的投影时,取到最大)。因此,量子迹距离是经典迹距离的上界,量子下的区分性更大。
假设
E
\mathcal E
E 是保迹量子操作,那么迹距离不增(区分器的输出分布统计距离不会变大),
D
(
E
(
ρ
)
,
E
(
σ
)
)
≤
D
(
ρ
,
σ
)
D(\mathcal E(\rho), \mathcal E(\sigma)) \le D(\rho,\sigma)
D(E(ρ),E(σ))≤D(ρ,σ)
特别的,偏迹也是量子操作,因此有
D
(
t
r
B
(
ρ
A
B
)
,
t
r
B
(
σ
A
B
)
)
≤
D
(
ρ
A
B
,
σ
A
B
)
D(tr_B(\rho^{AB}), tr_B(\sigma^{AB})) \le D(\rho^{AB},\sigma^{AB})
D(trB(ρAB),trB(σAB))≤D(ρAB,σAB)
迹距离的强凸性:两个混合态的概率有相同指标集,则
D
(
∑
i
p
i
ρ
i
,
∑
i
q
i
σ
i
)
≤
D
(
p
(
i
)
,
q
(
i
)
)
+
∑
i
p
i
D
(
ρ
i
,
σ
i
)
D(\sum_i p_i \rho_i, \sum_i q_i \sigma_i) \le D(p(i),q(i)) + \sum_i p_i D(\rho_i, \sigma_i)
D(i∑piρi,i∑qiσi)≤D(p(i),q(i))+i∑piD(ρi,σi)
保真度
量子态
ρ
,
σ
\rho,\sigma
ρ,σ 的保真度定义为
F
(
ρ
,
σ
)
:
=
t
r
(
ρ
1
/
2
σ
ρ
1
/
2
)
=
t
r
(
σ
1
/
2
ρ
σ
1
/
2
)
≥
0
F(\rho,\sigma) := tr(\sqrt{\rho^{1/2}\sigma\rho^{1/2}}) = tr(\sqrt{\sigma^{1/2}\rho\sigma^{1/2}}) \ge 0
F(ρ,σ):=tr(ρ1/2σρ1/2)=tr(σ1/2ρσ1/2)≥0
同样地,保真度在酉变换下不变,
F
(
U
ρ
U
†
,
U
σ
U
†
)
=
F
(
ρ
,
σ
)
F(U\rho U^\dagger, U\sigma U^\dagger) = F(\rho, \sigma)
F(UρU†,UσU†)=F(ρ,σ)
当
[
ρ
,
σ
]
=
0
[\rho,\sigma]=0
[ρ,σ]=0 对易时,量子保真度也退化为经典:
F
(
ρ
,
σ
)
=
t
r
(
∑
i
r
i
s
i
∣
i
⟩
⟨
i
∣
)
=
∑
i
r
i
s
i
=
F
(
r
(
i
)
,
s
(
i
)
)
F(\rho,\sigma) = tr(\sqrt{\sum_i r_is_i |i\rangle\langle i|}) = \sum_i\sqrt{r_is_i} = F(r(i),s(i))
F(ρ,σ)=tr(i∑risi∣i⟩⟨i∣)=i∑risi=F(r(i),s(i))
另外,当其中一个量子态是纯态
∣
ψ
⟩
|\psi\rangle
∣ψ⟩,那么
σ
=
∣
ψ
⟩
⟨
ψ
∣
\sigma=|\psi\rangle\langle\psi|
σ=∣ψ⟩⟨ψ∣ 满足
σ
=
σ
\sqrt{\sigma}=\sigma
σ=σ(一个本征值为
1
1
1,其他的皆为
0
0
0),于是
F
(
∣
ψ
⟩
,
ρ
)
=
F
(
ρ
,
∣
ψ
⟩
)
=
t
r
(
⟨
ψ
∣
ρ
∣
ψ
⟩
⋅
∣
ψ
⟩
⟨
ψ
∣
)
=
⟨
ψ
∣
ρ
∣
ψ
⟩
=
⟨
ρ
⟩
F(|\psi\rangle,\rho) = F(\rho,|\psi\rangle) = tr(\sqrt{\langle\psi|\rho|\psi\rangle \cdot |\psi\rangle\langle\psi|}) = \sqrt{\langle\psi|\rho|\psi\rangle} = \sqrt{\langle \rho \rangle}
F(∣ψ⟩,ρ)=F(ρ,∣ψ⟩)=tr(⟨ψ∣ρ∣ψ⟩⋅∣ψ⟩⟨ψ∣)=⟨ψ∣ρ∣ψ⟩=⟨ρ⟩
也就是说保真度就是算子 ρ \rho ρ 在纯态 ∣ ψ ⟩ |\psi\rangle ∣ψ⟩ 下的测量均值的平方根。
Uhlmann 定理:系统
Q
Q
Q 的密度算子
ρ
,
σ
\rho,\sigma
ρ,σ,我们引入一个系统
R
R
R 使它与
Q
Q
Q 的维数相同,那么
F
(
ρ
,
σ
)
=
max
∣
ψ
⟩
,
∣
ϕ
⟩
∣
⟨
ψ
∣
ϕ
⟩
∣
F(\rho,\sigma) = \max_{|\psi\rangle, |\phi\rangle} |\langle\psi|\phi\rangle|
F(ρ,σ)=∣ψ⟩,∣ϕ⟩max∣⟨ψ∣ϕ⟩∣
这里的极大是对 ρ , σ \rho,\sigma ρ,σ 在复合系统 Q + R Q+R Q+R 上的所有纯化态取的(纯态 ∣ ψ ⟩ = ∑ i λ i ∣ i Q ⟩ ∣ i R ⟩ |\psi\rangle = \sum_i \sqrt{\lambda_i} |i_Q\rangle|i_R\rangle ∣ψ⟩=∑iλi∣iQ⟩∣iR⟩ 是混合态 ρ = ∑ i λ i ∣ i Q ⟩ ⟨ i Q ∣ \rho = \sum_i \lambda_i |i_Q\rangle \langle i_Q| ρ=∑iλi∣iQ⟩⟨iQ∣ 的纯化,类似的 ∣ ϕ ⟩ |\phi\rangle ∣ϕ⟩ 是 σ \sigma σ 的纯化)。
保真度的强凹性:两个混合态的概率有相同指标集,则
F
(
∑
i
p
i
ρ
i
,
∑
i
q
i
σ
i
)
≥
∑
i
p
i
q
i
F
(
ρ
i
,
σ
i
)
F(\sum_i p_i \rho_i, \sum_i q_i \sigma_i) \ge \sum_i \sqrt{p_iq_i} F(\rho_i, \sigma_i)
F(i∑piρi,i∑qiσi)≥i∑piqiF(ρi,σi)
两者关系
第一个关系,
D
(
ρ
,
σ
)
+
F
(
ρ
,
σ
)
≥
1
D(\rho,\sigma) + F(\rho,\sigma) \ge 1
D(ρ,σ)+F(ρ,σ)≥1
第二个关系,
D
(
ρ
,
σ
)
2
+
F
(
ρ
,
σ
)
2
≤
1
D(\rho,\sigma)^2 + F(\rho,\sigma)^2 \le 1
D(ρ,σ)2+F(ρ,σ)2≤1
冯诺依曼熵
经典信息论中,使用 Shannon 熵 H ( X ) : = − ∑ x p ( x ) log p ( x ) H(X) := -\sum_x p(x)\log p(x) H(X):=−∑xp(x)logp(x)。而在量子情况下,量子态就是随机变量,因此用密度算子替换概率分布。量子态 ρ \rho ρ 的 Von Neumann 熵定义为:
S ( ρ ) : = − t r ( ρ log ρ ) ≥ 0 S(\rho) := - tr(\rho \log \rho) \ge 0 S(ρ):=−tr(ρlogρ)≥0
它与热力学的玻尔兹曼熵 S = t r ( − k B ρ ln ρ ) = k B ln Ω S = tr(-k_B\rho\ln\rho) = k_B \ln \Omega S=tr(−kBρlnρ)=kBlnΩ 几乎只相差个常数。
如果
d
d
d 维空间量子态
ρ
\rho
ρ 的本征值为
λ
x
\lambda_x
λx,那么就有如下更便于计算的式子,
S
(
ρ
)
=
−
∑
x
λ
x
log
λ
x
≤
log
d
S(\rho) = - \sum_x \lambda_x \log \lambda_x \le \log d
S(ρ)=−x∑λxlogλx≤logd
类比经典相对熵
K
L
(
p
∥
q
)
=
∑
x
p
(
x
)
log
p
(
x
)
q
(
x
)
KL(p\|q) = \sum_x p(x)\log\dfrac{p(x)}{q(x)}
KL(p∥q)=∑xp(x)logq(x)p(x),但是厄米阵
σ
\sigma
σ 不一定有逆。量子相对熵定义为:
S
(
ρ
∥
σ
)
:
=
t
r
(
ρ
log
ρ
)
−
t
r
(
ρ
log
σ
)
≥
0
S(\rho\|\sigma) := tr(\rho\log\rho) - tr(\rho\log\sigma) \ge 0
S(ρ∥σ):=tr(ρlogρ)−tr(ρlogσ)≥0
它取等号当仅当 ρ = σ \rho = \sigma ρ=σ(Klein 不等式)。
Fannes 不等式(量子熵的连续性):定义
T
(
ρ
,
σ
)
:
=
2
D
(
ρ
,
σ
)
T(\rho,\sigma):=2D(\rho,\sigma)
T(ρ,σ):=2D(ρ,σ) 以及
η
(
x
)
:
=
−
x
log
x
\eta(x):=-x\log x
η(x):=−xlogx,如果
d
d
d 维 Hilbert 空间中密度算子
ρ
,
σ
\rho,\sigma
ρ,σ 的迹距离满足
T
(
ρ
,
σ
)
≤
1
/
e
T(\rho,\sigma) \le 1/e
T(ρ,σ)≤1/e,那么
∣
S
(
ρ
)
−
S
(
σ
)
∣
≤
T
(
ρ
,
σ
)
log
d
+
η
(
T
(
ρ
,
σ
)
)
|S(\rho) - S(\sigma)| \le T(\rho,\sigma) \log d + \eta(T(\rho,\sigma))
∣S(ρ)−S(σ)∣≤T(ρ,σ)logd+η(T(ρ,σ))
仿照 Shannon 熵的样子,定义
- 量子联合熵 S ( A , B ) : = − t r ( ρ A B log ρ A B ) S(A,B) := -tr(\rho^{AB} \log \rho^{AB}) S(A,B):=−tr(ρABlogρAB)
- 量子条件熵 S ( A ∣ B ) : = S ( A , B ) − S ( B ) S(A|B) := S(A,B) - S(B) S(A∣B):=S(A,B)−S(B)
- 量子互信息 S ( A : B ) : = S ( A ) + S ( B ) − S ( A , B ) S(A:B) := S(A)+S(B)-S(A,B) S(A:B):=S(A)+S(B)−S(A,B)
量子熵的基本性质:
- S ( ρ ) ≥ 0 S(\rho) \ge 0 S(ρ)≥0,当仅当 ρ \rho ρ 是纯态时熵等于零。
- d d d 维 Hilbert 空间的熵至多为 log d \log d logd,完全混合态 I / d I/d I/d 时取等。
- 复合系统 A + B A+B A+B 如果处于纯态 ∣ ψ ⟩ = ∑ i λ i ∣ i A ⟩ ∣ i B ⟩ |\psi\rangle=\sum_i \sqrt{\lambda_i}|i_A\rangle|i_B\rangle ∣ψ⟩=∑iλi∣iA⟩∣iB⟩(Schmidt 分解,子系统有相同本征值),那么有联合熵 S ( A , B ) = 0 S(A,B)=0 S(A,B)=0 并且 S ( A ) = S ( B ) = − ∑ i λ i log λ i S(A)=S(B)=-\sum_i \lambda_i \log \lambda_i S(A)=S(B)=−∑iλilogλi,即纯态系统任意切分后的熵相等。
- 混合态的熵: S ( ∑ i p i ρ i ) = H ( p ) + ∑ i p i S ( ρ i ) S(\sum_i p_i\rho_i) = H(p) + \sum_i p_iS(\rho_i) S(∑ipiρi)=H(p)+∑ipiS(ρi),包括混合态概率分布的香农熵以及纯态系综的冯诺依曼熵均值
- 熵的可加性: S ( ρ ⊗ σ ) = S ( ρ ) + S ( σ ) S(\rho \otimes \sigma) = S(\rho) + S(\sigma) S(ρ⊗σ)=S(ρ)+S(σ),直积态的熵等于子系统熵的加和。
- 联合熵定理: S ( ∑ i p i ∣ i ⟩ ⟨ i ∣ ⊗ ρ i ) = H ( p ) + ∑ i p i S ( ρ i ) S(\sum_i p_i|i\rangle\langle i| \otimes \rho_i) = H(p) + \sum_i p_iS(\rho_i) S(∑ipi∣i⟩⟨i∣⊗ρi)=H(p)+∑ipiS(ρi),其中 ∣ i ⟩ |i\rangle ∣i⟩ 是子系统 A A A 的正交态, ρ i \rho_i ρi 是子系统 B B B 的密度算子集合。
- 量子条件熵可能是负数(香农条件熵 H ( Y ∣ X ) ≥ 0 H(Y|X) \ge 0 H(Y∣X)≥0),量子联合熵可能比子系统的量子熵更小(例如复合系统是纯态,它的子系统非纯态)。
给定一组完备的正交投影算子
{
P
i
}
\{P_i\}
{Pi},测后态
ρ
′
=
∑
i
P
i
ρ
P
i
\rho' = \sum_i P_i\rho P_i
ρ′=∑iPiρPi 的熵不会更小,
S
(
ρ
′
)
=
−
t
r
(
ρ
log
ρ
′
)
≥
S
(
ρ
)
S(\rho') = -tr(\rho\log \rho') \ge S(\rho)
S(ρ′)=−tr(ρlogρ′)≥S(ρ)
等号成立当仅当 ρ ′ = ρ \rho' = \rho ρ′=ρ。
量子熵的联合凹性:混合态
{
p
i
,
ρ
i
}
\{p_i,\rho_i\}
{pi,ρi},有
S
(
∑
i
p
i
ρ
i
)
≥
∑
i
p
i
S
(
ρ
i
)
S(\sum_i p_i \rho_i) \ge \sum_i p_i S(\rho_i)
S(i∑piρi)≥i∑piS(ρi)
等号成立当仅当对于 p i > 0 p_i >0 pi>0 的那些 ρ i \rho_i ρi 都相同。
量子熵的次可加性:复合系统
A
+
B
A+B
A+B 处于联合态
ρ
A
B
\rho^{AB}
ρAB,
∣
S
(
A
)
−
S
(
B
)
∣
≤
S
(
A
,
B
)
≤
S
(
A
)
+
S
(
B
)
|S(A)-S(B)| \le S(A,B) \le S(A) + S(B)
∣S(A)−S(B)∣≤S(A,B)≤S(A)+S(B)
量子熵的强次可加性:扩展到任意的三个量子系统
A
,
B
,
C
A,B,C
A,B,C,
S
(
A
)
+
S
(
B
)
≤
S
(
A
,
C
)
+
S
(
B
,
C
)
S
(
A
,
B
,
C
)
+
S
(
B
)
≤
S
(
A
,
B
)
+
S
(
B
,
C
)
S(A) + S(B) \le S(A,C) + S(B,C)\\ S(A,B,C) + S(B) \le S(A,B) + S(B,C)
S(A)+S(B)≤S(A,C)+S(B,C)S(A,B,C)+S(B)≤S(A,B)+S(B,C)
那么可以证明,
- 条件会减小熵:复合系统 A B C ABC ABC, S ( A ∣ B , C ) ≤ S ( A ∣ B ) S(A|B,C) \le S(A|B) S(A∣B,C)≤S(A∣B)
- 去掉系统不会增加互信息:复合系统 A B C ABC ABC, S ( A : B ) ≤ S ( A : B , C ) S(A:B) \le S(A:B,C) S(A:B)≤S(A:B,C)
- 量子操作不会增加互信息:复合系统 A B AB AB,子系统 B B B 上的保迹量子操作 E \mathcal E E 作用在复合系统上, S ( A ′ : B ′ ) ≤ S ( A , B ) S(A':B') \le S(A,B) S(A′:B′)≤S(A,B)
Holevo 界:如果 Alice 以概率
{
p
x
}
\{p_x\}
{px} 制备状态
{
ρ
x
}
\{\rho_x\}
{ρx},Bob 进行 POVM 元
{
E
y
}
\{E_y\}
{Ey} 的测量,测量结果是
Y
Y
Y,那么总有
H
(
X
:
Y
)
≤
χ
:
=
S
(
ρ
)
−
∑
x
p
x
S
(
ρ
x
)
H(X:Y) \le \chi := S(\rho) - \sum_x p_xS(\rho_x)
H(X:Y)≤χ:=S(ρ)−x∑pxS(ρx)
其中 ρ = ∑ x p x ρ x \rho = \sum_xp_x\rho_x ρ=∑xpxρx 是它们的混合。Holevo 界给出了执行测量所能获得的信息上界,是量子信息论的基石。
信源编码
信源编码:压缩技术,去除冗余信息。信道编码:容错技术,添加冗余信息。
经典
对于经典信息论,经典信源以概率
{
p
(
x
)
}
\{p(x)\}
{p(x)} 独立地产生随机比特
X
X
X。字符串
x
1
x
2
⋯
x
n
x_1x_2\cdots x_n
x1x2⋯xn 叫做
ϵ
\epsilon
ϵ-典型序列,满足
2
−
n
(
H
(
X
)
+
ϵ
)
≤
p
(
x
1
,
x
2
,
⋯
,
x
n
)
≤
2
−
n
(
H
(
X
)
−
ϵ
)
2^{-n(H(X)+\epsilon)} \le p(x_1,x_2,\cdots,x_n) \le 2^{-n(H(X)-\epsilon)}
2−n(H(X)+ϵ)≤p(x1,x2,⋯,xn)≤2−n(H(X)−ϵ)
将它们收集到集合 T ( n , ϵ ) T(n,\epsilon) T(n,ϵ) 中,称为 ϵ \epsilon ϵ-典型序列集合。
典型序列定理:
- 固定 ϵ > 0 \epsilon >0 ϵ>0,任意的 δ > 0 \delta>0 δ>0 和充分大的 n ∈ Z + n \in \mathbb Z^+ n∈Z+,随机一个序列是 ϵ \epsilon ϵ-典型序列的概率至少为 1 − δ 1-\delta 1−δ(几乎都是典型的)
- 固定 ϵ > 0 \epsilon >0 ϵ>0,任意的 δ > 0 \delta>0 δ>0 和充分大的 n ∈ Z + n \in \mathbb Z^+ n∈Z+,那么 ϵ \epsilon ϵ-典型序列的数目为 ( 1 − δ ) 2 n ( H ( X ) − ϵ ) ≤ ∣ T ( n , ϵ ) ∣ ≤ 2 n ( H ( X ) + ϵ ) (1-\delta)2^{n(H(X)-\epsilon)} \le |T(n,\epsilon)| \le 2^{n(H(X)+\epsilon)} (1−δ)2n(H(X)−ϵ)≤∣T(n,ϵ)∣≤2n(H(X)+ϵ)
- 固定 R < H ( X ) R<H(X) R<H(X),令 S ( n ) S(n) S(n) 是大小 2 n R 2^{nR} 2nR 的 n n n 长序列的收集,对于任意的 δ > 0 \delta>0 δ>0 和充分大的 n ∈ Z + n \in \mathbb Z^+ n∈Z+,有 ∑ x ∈ S ( n ) p ( x ) ≤ δ \sum_{x\in S(n)} p(x) \le \delta ∑x∈S(n)p(x)≤δ(占比任意小)
Shannon 无噪声信道的编码定理:令 { X i } \{X_i\} {Xi} 是熵为 H ( X ) H(X) H(X) 的独立同分布信源,
- 如果 R > H ( X ) R>H(X) R>H(X),那么存在码率 R R R 的可靠压缩方案
- 如果 R < H ( X ) R<H(X) R<H(X),那么任意码率 R R R 的压缩方案都不可靠
量子
对于量子信息论,Hildert 空间
H
H
H 上的量子信源的密度算子为
ρ
=
∑
x
p
x
∣
x
⟩
⟨
x
∣
\rho = \sum_x p_x|x\rangle\langle x|
ρ=∑xpx∣x⟩⟨x∣(满足
S
(
ρ
)
=
H
(
p
)
S(\rho)=H(p)
S(ρ)=H(p)),它独立地产生随机量子态
∣
X
⟩
|X\rangle
∣X⟩。量子态
∣
x
1
x
2
⋯
x
n
⟩
|x_1x_2\cdots x_n\rangle
∣x1x2⋯xn⟩ 叫做
ϵ
\epsilon
ϵ-典型状态,满足
2
−
n
(
H
(
X
)
+
ϵ
)
≤
p
(
x
1
,
x
2
,
⋯
,
x
n
)
≤
2
−
n
(
H
(
X
)
−
ϵ
)
2^{-n(H(X)+\epsilon)} \le p(x_1,x_2,\cdots,x_n) \le 2^{-n(H(X)-\epsilon)}
2−n(H(X)+ϵ)≤p(x1,x2,⋯,xn)≤2−n(H(X)−ϵ)
将这些典型状态张成的子空间叫做
ϵ
\epsilon
ϵ-典型子空间,记为
T
(
n
,
ϵ
)
T(n,\epsilon)
T(n,ϵ)。到
T
(
n
,
ϵ
)
T(n,\epsilon)
T(n,ϵ) 的投影算子记为
P
(
n
,
ϵ
)
P(n,\epsilon)
P(n,ϵ),
P
(
n
,
ϵ
)
=
∑
x
∈
T
(
n
,
ϵ
)
∣
x
1
⟩
⟨
x
1
∣
⊗
⋯
⊗
∣
x
n
⟩
⟨
x
n
∣
P(n,\epsilon) = \sum_{x \in T(n,\epsilon)} |x_1\rangle\langle x_1| \otimes \cdots \otimes |x_n\rangle\langle x_n|
P(n,ϵ)=x∈T(n,ϵ)∑∣x1⟩⟨x1∣⊗⋯⊗∣xn⟩⟨xn∣
典型子空间定理:
-
固定 ϵ > 0 \epsilon >0 ϵ>0,任意的 δ > 0 \delta>0 δ>0 和充分大的 n ∈ Z + n \in \mathbb Z^+ n∈Z+,随机一个序列是 ρ ⊗ n \rho^{\otimes n} ρ⊗n 满足
t r ( P ( n , ϵ ) ρ ⊗ n ) ≥ 1 − δ tr(P(n,\epsilon) \rho^{\otimes n}) \ge 1-\delta tr(P(n,ϵ)ρ⊗n)≥1−δ
即 ρ ⊗ n \rho^{\otimes n} ρ⊗n 几乎总是落入 ϵ \epsilon ϵ-典型子空间。 -
固定 ϵ > 0 \epsilon >0 ϵ>0,任意的 δ > 0 \delta>0 δ>0 和充分大的 n ∈ Z + n \in \mathbb Z^+ n∈Z+,那么 ϵ \epsilon ϵ-典型子空间的维数 ∣ T ( n , ϵ ) ∣ = t r ( P ( n , ϵ ) ) |T(n,\epsilon)| = tr(P(n,\epsilon)) ∣T(n,ϵ)∣=tr(P(n,ϵ)) 满足
( 1 − δ ) 2 n ( S ( ρ ) − ϵ ) ≤ ∣ T ( n , ϵ ) ∣ ≤ 2 n ( S ( ρ ) + ϵ ) (1-\delta)2^{n(S(\rho)-\epsilon)} \le |T(n,\epsilon)| \le 2^{n(S(\rho)+\epsilon)} (1−δ)2n(S(ρ)−ϵ)≤∣T(n,ϵ)∣≤2n(S(ρ)+ϵ) -
固定 R < S ( ρ ) R<S(\rho) R<S(ρ),令 S ( n ) S(n) S(n) 是到 Hilbert 空间 H ⊗ n H^{\otimes n} H⊗n 的任意至多 2 n R 2^{nR} 2nR 维子空间到的一个投影算子,对于任意的 δ > 0 \delta>0 δ>0 和充分大的 n ∈ Z + n \in \mathbb Z^+ n∈Z+,有
t r ( S ( n ) ρ ⊗ n ) ≤ δ tr(S(n)\rho^{\otimes n}) \le \delta tr(S(n)ρ⊗n)≤δ即 ρ ⊗ n \rho^{\otimes n} ρ⊗n 几乎不落入这个至多 2 n R 2^{nR} 2nR 维子空间。
纠缠保真度:一个 i.i.d 量子信源由 Hilbert 空间
Q
Q
Q 和密度算子
ρ
\rho
ρ 所描述,引入另一个系统
S
S
S 使得
S
Q
SQ
SQ 联合状态是纯态(纯化),那么
ρ
\rho
ρ 中的混合性质被视为由
Q
Q
Q 和
S
S
S 的纠缠所造成。保迹量子操作
E
\mathcal E
E 作用于
ρ
\rho
ρ,它保持纠缠程度的度量为
F
(
ρ
,
E
)
:
=
F
(
S
Q
,
S
′
Q
′
)
2
=
⟨
S
Q
∣
ρ
S
′
Q
′
∣
S
Q
⟩
F(\rho,\mathcal E) := F(SQ,S'Q')^2 = \langle SQ|\rho^{S'Q'}|SQ\rangle
F(ρ,E):=F(SQ,S′Q′)2=⟨SQ∣ρS′Q′∣SQ⟩
其中 S ′ Q ′ = E ( S Q ) S'Q' = \mathcal E(SQ) S′Q′=E(SQ)。如果 { E i } \{E_i\} {Ei} 是 E \mathcal E E 的操作元,那么 F ( ρ , ϵ ) = ∑ i ∣ t r ( E i ρ ) ∣ 2 F(\rho,\epsilon) = \sum_i |tr(E_i\rho)|^2 F(ρ,ϵ)=∑i∣tr(Eiρ)∣2。
码率 R R R 的压缩方案,它包括两个保迹量子操作 C n , D n C^n, D^n Cn,Dn,它们在 H ⊗ n H^{\otimes n} H⊗n 和 2 n R 2^{nR} 2nR 维子空间之间映射。我们说压缩方案可靠,如果对于充分大的 n n n,纠缠保真度 F ( ρ ⊗ n , D n ∘ C n ) F(\rho^{\otimes n}, D^n \circ C^n) F(ρ⊗n,Dn∘Cn) 趋近于 1 1 1,也就是说 encode/decode 之后纠缠程度基本不变。
Schumacher 无噪声信道的编码定理:令 { H , ρ } \{H,\rho\} {H,ρ} 是一个 i.i.d 量子信源,
- 如果 R > S ( ρ ) R>S(\rho) R>S(ρ),那么存在码率 R R R 的可靠压缩方案(纠缠保真度趋近于 1 1 1)
- 如果 R < S ( ρ ) R<S(\rho) R<S(ρ),那么任意码率 R R R 的压缩方案都是完全不可靠的(纠缠保真度趋近于 0 0 0)
HSW 定理:假设信道
E
\mathcal E
E 是一个保迹量子操作(信道被视为对传输中的量子态执行了操作),定义
χ
(
E
)
:
=
max
{
p
i
,
ρ
i
}
[
S
(
E
(
∑
i
p
i
ρ
i
)
)
−
∑
j
p
j
S
(
E
(
ρ
j
)
)
]
\chi(\mathcal E) := \max_{\{p_i,\rho_i\}} \left[ S(\mathcal E(\sum_i p_i\rho_i)) - \sum_j p_j S(\mathcal E(\rho_j)) \right]
χ(E):={pi,ρi}max[S(E(i∑piρi))−j∑pjS(E(ρj))]
其中的极大是对于所有可能的系综
{
p
i
,
ρ
i
}
\{p_i,\rho_i\}
{pi,ρi} 取得的(这是信源么),那么信道容量为:
C
(
1
)
(
E
)
=
χ
(
E
)
C^{(1)}(\mathcal E) = \chi(\mathcal E)
C(1)(E)=χ(E)