态叠加原理

原理的数学表述

  量子力学要求动力学系统的态和动力学变量以一种相当奇怪的方式联系起来。态与动力学变量必须用一些数学上的量来表示,这些量与物理学中常用的量有不同的性质。

  各量子态之间的数学关系来自叠加原理的数学表述,叠加过程是一种相加的过程,这隐含着几个态能以某种方式相加而给出新的态。因此,这些态必定和这样一类的数学量联系——这一类的量可以加在一起而给出同样类型的其他量。最明显的这类量就是 矢量,但有限维空间中的普通矢量对量子力学中的大部分动力学系统而言不够普遍,必须推广至无限维空间中的矢量,而数学处理因收敛性问题而变得复杂。

  但是现在,我们仅仅处理这类矢量的某些一般性质,不深入到收敛性及其相关问题,直到有讨论的必要。

  以下讨论均在 复数域上的 Hilbert 空间 中进行。

左矢与右矢

右矢:一个量子态

  描述这些与量子态相关的矢量有一个特别的名称,就是 右矢(ket),它们可以通过叠加而构成新的右矢:

c1A+c2B=R c_1|A⟩ + c_2 |B\rangle = |R\rangle

如果一个右矢依赖于参数 xx ,此参数在一定的范围内可以连续取值,那么可以对它的无穷序列线性叠加:

xdx=Q \int |x\rangle \mathrm{d}x = |Q\rangle

如果一个右矢能够被集合中其他右矢线性表示,就称它们线性相关,否则线性无关

  现在假定,在某一特定时刻动力学系统的每个态对应于一个右矢,其对应关系是这样的:

如果一个态是由某些其他态叠加而成的,那么它所对应的右矢与这些其他态对应的右矢线性的表示,反之亦然。

这一假设导出了叠加的某些性质:叠加过程对参与叠加的各态都是对称的,它们在叠加中出现的次序并不重要。

  为了继续叠加原理的数学表述,必须再引入一个假设,那就是一个态与本身的叠加无法得到新的态,比如

c1A+c2A=(c1+c2)A c_1|A⟩ + c_2 |A\rangle = (c_1+c_2)|A\rangle

c1+c2=0c_1+c_2=0 ,则干涉相消,什么都得不到。但新的假设要求,除了这种特殊情况,其结果的态和原先的态完全一样。所以态是由右矢的方向确定的,而给右矢规定的任意长度无关紧要,并且 A-|A\rangleA|A\rangle 的方向没有任何区别。

  这样一来,只有叠加系数的比是有效的,它由一个复的参量或者两个实的参量确定,所以从两个已知的态出发,利用叠加得到的态的总数是二重无穷大。

左矢:右矢的对偶

  在右矢空间 V={A}V=\{|A\rangle\} 中定义一个线性函数,这样的线性函数总是可以看做是 A|A\rangle 与某个新的矢量的标量积(通过作标量积来实现这个function),满足这样关系的新的矢量就称为 左矢,它来自右矢的线性函数,是右矢的对偶,同样可以通过相加和数乘给出其他同类型的左矢。

  左矢与右矢的标量积写为 AB\langle A | B \rangle ,这是一个完整括号。我们规定任何完整括号表达式表示一个数,而不完整括号表达式表示一个矢量,根据它是否包含了括号的第一或第二部分来确定是左矢还是右矢。

  既然左矢是右矢的一个线性函数,那么只要一个左矢与任意右矢的标量积定义了,这个左矢也就完全定义了。左矢之和则定义为

{B+B}A=BA+BA \{\langle B| + \langle B'|\} \,|A\rangle = \langle B|A\rangle + \langle B' |A\rangle

就像广义函数的定义——只有作用于右矢,左矢才能体现出它的价值。

  这里引入的左矢是与右矢完全不同的矢量,到目前为止它们之间还没有任何联系,只是在左矢与右矢之间存在标量积。现在假定:

左矢和右矢之间存在一一对应关系,即对应于的 A+A|A\rangle + |A'\rangle 左矢等于对应于 A|A\rangle 的左矢与对应于 A|A'\rangle 的左矢之和,而对应于 cAc|A\rangle 的左矢 等于 c\overline{c} 乘上 A|A\rangle 对应的左矢,这里 c\overline{c}cc 对应的共轭复量

我们就把这样的左矢写作 A\langle A |

  右矢与对应左矢之间的关系,使我们可以合理地称呼它们中的一类是另一类的 共轭虚量,它们是一类特殊的复量,不能将它们分为实部和虚部。

  考虑到左矢和右矢之间的一一对应关系,我们动力学系统在某一时刻的任意状态既可以用右矢表示,也可以用左矢表示,整个理论 在左矢和右矢之间本质上是对称的。

  称两个左矢或右矢正交,如果其中之一与另一个的共轭虚量的标量积为 00

  上述的各假设给出了某一特定时刻的动力学系统的各态之间关系的完整方案,这些方案表现为数学形式,但它们隐含着某些物理条件(比如正交对应了什么物理意义?)。随着理论的进一步发展,这些物理条件将导出可以用观测表达的结果。

动力学变量与可观测量

必要的数学基础

  前面我们讨论了左矢的含义:是一个右矢的线性函数的“数”的对应物,得到某个右矢的对应数值总是可以通过将它与这个左矢作标量积而实现。现在我们要考虑作为右矢的线性函数的右矢,它将会引出 算符 的概念。

  以下将会引入大量线性代数的知识,主要集中于线性变换 A\mathcal{A} 及其对应矩阵 AA 的特征与相似性质,请读者继续阅读前务必保证已经掌握足够的线性代数知识。如果没有,请参考[2]的第六章靠后部分以及第七章。

  为了提高狄拉克符号的熟练度,我们将右矢 A|A\rangle 想象为 Hilbert 空间中某区域的一个矢量 α\alpha,左矢 A\langle A | 想象为另一个区域的一个矢量 β\beta这两个区域互不重叠,但充满整个 HIllbert 空间。而将算符想象为抽象的 线性变换 A\mathcal{A},表象是一组正交基,所以算符(线性变换)在不同表象(基)下的矩阵(做具体操作的,比如 ix\frac{\hbar}{i}\frac{\partial}{\partial x} ,当然如果这样说那么需要证明一个这样的微分算子和一个矩阵是相联系的)不同,但是这些矩阵(具体算符)具有一定的联系。

  或许,不如这样说:

  1. 复数域上无穷维线性空间中的向量被分为两部分(左矢和右矢),它们服从共轭转置的对应关系;
  2. 这个线性空间定义了内积(两个右矢的内积和两个左矢的内积),并且是完备的,在其中可以找到一些标准正交基( δ\delta 函数),比如坐标表象和动量表象;
  3. 线性空间中存在线性变换(坐标 算符 x^\hat{x} 和动量算符 p^\hat{p}),取一组基可以将它表示为在该组基下的矩阵;
  4. 由于这样的矩阵是无穷维的,它常常用一个微分 算子 代为表示;
  5. 坐标表象和动量表象都是标准正交基,之间的转换服从正交变换,变换的矩阵以 Fourier 变换代替。

  这里我故意将算符和算子区别开。本文的“算符”二字,是指作用与抽象线性空间中的线性变换;而“算子”二字,是指进入某一表象后算符在这组表象下的具体表示,它可以是微分,也可以是矩阵,只不过常常以微分的形式出现而已。

表象理论

物理量与表象

  为了量化某个物体的物理性质,我们需要用到一些数(可以是一个,也可以是多个),他们的集合称为 物理量。有的物理量只需要一个数就能完全描述,例如质量、能量;但有的却不能。为了完全描述一个更为复杂的物理量,我们需要使用更多的数,我们就讲这些数称为 分量。描述同一物理性质的分量应当有某种结构或者组织形式,这是因为这些复杂的物理量大多与这个物理性质的各向异性有关。体现在这些数上,就是不同位置的数不能随意交换,应当按照某些顺序排列起来。

  此外,坐标系在描述物理系统的演化时也具有非常关键的作用,而不同参考系之间存在一定的变换,在经典力学中即是 正交变换, 它是欧氏空间中保内积、保长度、保标准正交基的变换。

  在不同坐标系中,我们不能先验地认为某量在不同坐标系下的分量具有某种关系。然而,基于对周遭世界客观实在的信念,物理量及物理规律应当独立于人为设定的参考系而存在。也就是说,这是物理对象的内禀性质,不以人的意志为转移。

  所以,一个量能被称为物理量,理应具有某种特殊的性质,即这个量在不同坐标系中的分量之间的关系应当是确定的——仅与联系两个坐标系的正交变换有关,而与两个参考系无关。

  坐标系的本质是欧氏空间中的一组标准正交基。正如在不依赖这组基时,我们依然可以谈论某个线性变换 A\mathscr{A} 的特征值与特征向量一般,不选取坐标系我们依然可以谈论某个物理量的某些本质性质,只不过不太适应这种抽象表述而已。

  将“坐标系”的概念推而广之,就是 representation,“表象”。无论是在线性空间中选择某组基,还是以你所站立的点为原点、经纬线分别作为 X、Y 轴建立直角坐标系,都是选择了一种观察、看待某个对象(线性变换 A\mathscr{A}、苹果落地)的方式,它是人为选择的,决定了对象在我们面前的呈现形式,也就是“表象”二字的字面含义。

  而这种 representation invariance 的观点也是量子力学的基石。一个例子是如下形式的薛定谔方程

iψt=22m2ψx2+V(x)ψ i\hbar \frac{\partial \psi}{\partial t} = -\frac{\hbar^2}{2m}\frac{\partial ^2 \psi}{\partial x^2}+ V(x)\psi

即是以态矢表示的薛定谔方程

iddtψ(t)=H^ψ(t) i \hbar \frac{\mathrm{d}}{\mathrm{d} t}|\psi(t)\rangle=\hat{H}|\psi(t)\rangle

在坐标表象下的呈现形式而已。为了确认这一点,我们只需在方程左右同时左乘 x\langle x | 即可。

  另一个和表象的含义相似的词汇为 “绘景”。不同绘景的区别实际上也是我们看待量子系统演化的不同方式。薛定谔绘景、海森堡绘景以及相互作用绘景的核心区别,就在于怎样在态矢与算符之间分配这个传播子 U\mathcal{U}

  对表象理论更细致的讨论参见[4]的第一章。

简单应用

薛定谔方程的形式解

iddtψ(t)=H^ψ(t) i \hbar \frac{\mathrm{d}}{\mathrm{d} t}|\psi(t)\rangle=\hat{H}|\psi(t)\rangle

的形式解为

ψ(t)=eiH^(tt0)/ψ(t0) |\psi(t)\rangle=e^{-i \hat{H}\left(t-t_0\right) / \hbar}\left|\psi\left(t_0\right)\right\rangle

如果哈密顿算符满足

H^n=Enn \hat{H}|n\rangle=E_n|n\rangle

则令 a=i(tt0)/a = -i \left(t-t_0\right) / \hbar

ψ(t)=eaH^ψ(t0)=ajj!H^jnnψ(t0)=ajj!Enjnnψ(t0)=eaEnnnψ(t0) \begin{aligned} |\psi(t)\rangle&=e^{a\hat{H}}\left|\psi\left(t_0\right)\right\rangle\\ &=\frac{a^j}{j!}\hat{H}^j\cdot|n\rangle \langle n| \psi\left(t_0\right)\rangle\\ &= \frac{a^j}{j!}E_n^j|n\rangle \langle n| \psi\left(t_0\right)\rangle\\ &=e^{aE_n}|n\rangle \langle n| \psi\left(t_0\right)\rangle\\ \end{aligned}

ψ(t)=neiEn(tt0)/nψ(t0)n |\psi(t)\rangle=\sum_n e^{-i E_n\left(t-t_0\right) / \hbar}\left\langle n \mid \psi\left(t_0\right)\right\rangle|n\rangle

双态系统

  对于双态系统,它的哈密顿算符为

H^=β(x1x2+x2x1) \hat{H}=\beta(|x_1\rangle\langle x_2|+| x_2\rangle\langle x_1|)

x1,x2|x_1\rangle,|x_2\rangle 表象下,哈密顿算符成为矩阵算子(张量在基下的分量),它的 ijij 元为

Hij=xiH^xj H_{ij} = \langle x_i | \hat{H} |x_j \rangle

对角化,求得其本征值为 β,β\beta,-\beta ,对应的本征矢为

ψ+=12[1,1]T12(x1+x2)+,ψ=12[1,1]T12(x1x2). \begin{aligned} &\psi_{+}=\frac{1}{\sqrt{2}}[1,1]^T \Longrightarrow \frac{1}{\sqrt{2}}(|x_1\rangle+|x_2\rangle) \equiv|+\rangle, \\ &\psi_{-}=\frac{1}{\sqrt{2}}[1,-1]^T \Longrightarrow \frac{1}{\sqrt{2}}(|x_1\rangle-|x_2\rangle) \equiv|-\rangle . \end{aligned}

如果系统最初处于 x1|x_1\rangle 的初始状态,求解薛定谔方程,得到

ψ(t)=eiH^t/x1=eiβt/++x1+eiβt/x1=cos(βt)x1isin(βt)x2. \begin{aligned} |\psi(t)\rangle &=e^{-i \hat{H} t / \hbar}|x_1\rangle=e^{-i \beta t / \hbar}|+\rangle\langle+\mid x_1\rangle+e^{i \beta t / \hbar}|-\rangle\langle-\mid x_1\rangle \\ &= \cos \left(\frac{\beta t}{\hbar}\right)|x_1\rangle-i \sin \left(\frac{\beta t}{\hbar}\right)|x_2\rangle . \end{aligned}

这是在状态 x1|x_1\ranglex2|x_2\rangle 之间的来回振荡。

  从计算中可以看出,哈密顿算符的本征矢量并不是它表达式中出现的那两个正交矢量,而是对它们又进行了旋转之后得到的新的正交矢量。所以双态系统的状态只能在 x1,x2|x_1\rangle, |x_2\rangle 之间来回摇摆,并且摆不到 H^\hat H 的本征矢上来,但经过测量又能够得到这两个本征矢。

参考资料

[1].Dirac, The Principles of Quantum Mechanics, 机械工业出版社

[2].李尚志,线性代数(数学专业用),高等教育出版社

[3].Brian C. Hall, Quantum Theory for Mathematicians, 世界图书出版公司

[4].樱井纯, 现代量子力学 第二版 中译本修订版, 世界图书出版公司, 2021