波束の収縮とは？量子論の公理を深掘り解説

はじめに

量子論には2種類の時間発展のルールがあると説明されます。

一つはシュレディンガー方程式に従う線形で連続的な時間発展で、もう一つは射影公理に代表される非線形で不連続な状態の更新です。

力学や電磁気学など、時間発展を扱う理論においては連続なものが多く登場するため、この射影公理に違和感を覚える人は多くいます。
特に、観測問題と呼ばれる物理学の外の領域にまで持ち越して何かしらの納得を得ようとした歴史もあります。

本記事ではその辺りの混乱を初学者が体験せずに済むように、純粋に(量子)確率論の使用の観点から射影公理を解説します。

射影公理への違和感

射影公理は、測定をした瞬間に測定値に対応する部分空間に状態が射影されるという、確率分布の変化の法則です。
理想的な測定で結果 \(x\) が得られたとします。このとき、密度行列 \(\rho\) は

\rho \mapsto \frac{P_x \rho P_x}{\mathrm{Tr}(P_x \rho)}

と、射影演算子 \(P_x\) によって計算できるという要請が射影公理の数式による表現です。

よくある解説では、射影公理は測定による知識の増加を表していると説明されています。

しかし、これらの説明は以下の2点が不足しているように感じます。

まず第一に、なぜそのようなルールを設ける必要があるのか？という点です。
古典確率論においても古典的な測定を定式化することはできますが、その際には射影公理という確率論の範囲外のルールは不要であり、登場しません。
同じ確率の理論であるのに、量子の場合にだけ射影公理を仮定するのは奇妙に感じます。

第二に、一般の測定においては測定後状態は射影公理を満たさないという点です。
特に有名な2重スリット実験においても、測定後の電子はスクリーンに吸われてスクリーン内に拡散するので、測定後状態はわからなくなります。
また、代表的な物理量である運動量でさえ、通常は測定相互作用で乱されて射影公理に従わないのが普通です。

以上から、標準的な射影公理の解説には不満があります。
そこで本記事では射影公理を条件付き確率によって導出できるという(よく知られているのかは分からない)結果について解説します。

雑談
ちなみに射影公理と似た用語として「波束の収縮」がありますが、正確には異なる概念を指しています。

波束の収縮は、波動関数が確率分布ではなく何かしらの物質の波として捉えられていた時代の混乱によって生まれた言葉です。
「波動関数で定められた確率に従って一つの測定値を得る」という普通の測定の話を、概念的に混乱していたことで「物質の波が測定によって測定値付近に収縮する」という謎現象だと思ってしまった、というのが現代的な説明になるかと思います。

古典確率における測定後の状態

量子論の説明に入る前に、古典確率における測定と測定後の状態の扱いを説明します。

まず重要なのは、確率が何に対して定められる概念か？ということです。
古典論でも量子論でも、確率は「測定の試行」に対して定義されています。
「測定の試行」とは、対象系と測定装置を相互作用させた後に装置から測定値を読み出す、という一連の定められた行為を表しています。

古典的な確率変数 \(X\) を、測定装置が示す値 \(Y\) で測定するには、

p(x) \to p(x,y)

と二つの変数の間に測定相互作用で相関を作り、その後で \(Y\) を測定します。

ここで注意が必要なのは、\(X\)の状態(=確率分布)が変化するのは測定相互作用の時であり、\(Y\)の読み出しの時には何も起きないということです。

これは、確率が測定の試行に対して定められていることから明らかです。
なぜなら\(Y\)の読み出しは\(X\)の試行に影響を与えないからです。
しかし直感的には\(Y\)を知ったら\(X\)の曖昧さは減少し、確率分布は変化していそうだと感じるでしょう。
それは「得られた\(Y=y\)で条件づけた上で\(X\)を再測定する」という試行に暗黙のうちに乗り換えているためです。
この条件付けられた試行で定義される確率を条件付き確率と言い、

p(x \mid y) := \frac{p(x,y)}{p(y)},\quad p(y) := \sum_x p(x,y)

と定義します。

この乗り換え手続きを採用すると、古典確率における測定後状態とは測定値 \(Y=y\) で条件付けた分布 \(p(x \mid y)\) のことである、と表現できます。

この更新には、特別な公理は必要ありません。どの試行に対する確率を見ているのかを切り替えただけであり、その切り替えは条件付き確率として自然に書けます。

雑談
関連した話題として、「測定すると状態が確定する」という表現も不適切だと思っています。
測定値と状態は分けて考えるべきで、測定によって確定するのは測定値そのものであり、状態は変わりません。
前述の通り、状態は相互作用で変化しますが、測定値を読んだ時には状態は何も変化しません。

量子論における理想的な測定

古典確率では、対象に影響を与えない測定相互作用を仮定することが多いため、先ほどの説明では触れませんでした。

ところが量子論では話が違います。

量子論において \(X\) を測る相互作用は、\(X\) と非可換な物理量を乱すため、相互作用を真面目に考える必要があります。

そこで特殊なケースとして、量子論において最も対象を乱さない理想的な測定を定式化します。
以下では、この理想的な測定において射影公理が導出されることを見ていきます。

量子論における最大の非破壊性

測定において確率分布が乱されないという条件を非破壊と言います。
全物理量が測定で乱されないという理想を諦めて、非破壊の対象を \(X\) と可換な物理量に限るとします。

つまり、\(X\) と同時に確定できる情報は可能な限り乱さない、という条件を考えます。

この条件を少し丁寧に書くために、\(X\) と可換な物理量全体の集合を

\mathcal{C}_X=\{A\mid A=A^\dagger,\ [A,X]=0\}

と定義します。

測定器の初期状態を \(\sigma\) とします。この測定相互作用が、任意の\(A\in\mathcal{C}_X\) に対して非破壊(すなわち確率分布が不変)であることは

\mathcal{E}^\dagger(A) := \mathrm{Tr}_M\left[U^\dagger(A\otimes I)U(I\otimes\sigma)\right]=A

という条件式と同値です。ここで、\(\mathrm{Tr}_M\)は測定器系の部分トレースを表します。

\(A\)としてあらゆる射影演算子を選択して色々計算すると、測定相互作用\(U\)は

U(I\otimes\sigma)=\sum_x(P_x\otimes U_x)(I\otimes\sigma)

という形で展開できることが示せます。\(U_x\)はユニタリー演算子です。

ここで、\(P_x\)はスペクトル分解

X=\sum_x x P_x

に登場する射影演算子です。

測定器状態の識別可能性

次に、測定器から \(X\) の値を正確に読み出すための条件を考えます。

仮に対象系が確率1で \(X=x'\) となる状態、すなわち

p(x)=\mathrm{Tr}(P_x\rho_{x'})=\delta_{xx'}

を満たす状態\(\rho_{x'}\)にあるとします。
この時、先ほどの測定相互作用によって測定器系の状態は

\sigma_{x'}:=\mathrm{Tr}_S(U\rho_{x'}\otimes\sigma U^\dagger)=U_{x'}\sigma U_{x'}^\dagger

へ移ります。\(\mathrm{Tr}_S\)は対象系の部分トレースです。

この設定において、各\(x\)に対応する状態\(\rho_{x}\)を確実に識別するためには、確率1で測定器の読み値が\(Y=x\)となる必要があります。

すなわち、測定器側に射影演算子 \(Q_y\) が存在して、各\(\sigma_x\)は

p(\sigma_x において Y=y)=\mathrm{Tr}(Q_y\sigma_x)=\delta_{xy}

を満たす必要があります。

この式から、\(0\leq\sigma_x,\ 0\leq Q_y\leq I\)より

\begin{aligned} \mathrm{Tr}((I-Q_y)\sigma_x )=0&\Leftrightarrow Q_y\sigma_x =\sigma_x\quad (x=y) \\[0.45em] \mathrm{Tr}(Q_y\sigma_x)=0&\Leftrightarrow Q_y\sigma_x =0\quad (x\neq y) \end{aligned}

が得られ、まとめると

Q_y\sigma_x=\delta_{xy}\sigma_x

が導けます。

\(\sigma_x=U_x\sigma U_x^\dagger\) を代入すると、

Q_yU_x\sigma=\delta_{xy}U_x\sigma

が得られます。

以上で得られた結果をまとめると、最大に非破壊かつ測定器状態が識別可能な測定では

\begin{align*} U(I\otimes\sigma)&=\sum_x(P_x\otimes U_x)(I\otimes\sigma), \\[0.45em] Q_yU_x\sigma&=\delta_{xy}U_x\sigma \end{align*}

の二つの条件式が満たされていることが分かりました。
この二つの式が得られれば射影公理はすぐに導かれます。

射影公理の導出

ここから、測定後の状態を実際に計算します。

ここで量子状態とは何か？をおさらいします。
量子状態とは、「さまざまな物理量の確率分布を与えるソース」です。
従って測定後状態とは「さまざまな物理量の測定値で条件付けられた確率分布を与えるソース」のことであると定義できます。

状態を定義するために、任意物理量を \(A\) の測定の確率を考えます。
射影演算子 \(E_a\) によってスペクトル分解

A=\sum_a aE_a

ができるとします。

ここでの \(A\) は、完全に任意であり、\(X\) と可換とは限りません。

目標は、測定器の\(Y\) と、任意物理量 \(A\) の同時確率

\[p(a,y)\]

を求めることです。これが分かれば、あとは古典確率と同じように

p(a \mid y)=\frac{p(a,y)}{p(y)}

を考えて、これを定める量子状態を決定できるはずです。

まず、系の初期状態を \(\rho\)、測定器の初期状態を \(\sigma\) とします。

前述の通り、\(X\) についての最大非破壊性を満たす測定相互作用は、

U(I\otimes\sigma)=\sum_x(P_x\otimes U_x)(I\otimes\sigma)

を満たします。

したがって、測定相互作用後の合成系の状態は

\begin{align*} U(\rho \otimes \sigma) &= U(I\otimes\sigma)(\rho\otimes I) \\[0.45em] &=\sum_{x}\left(P_x\otimes U_x\right)(I\otimes\sigma)(\rho\otimes I) \\[0.45em] &=\sum_{x}\left(P_x\otimes U_x\right)(\rho\otimes\sigma) \end{align*}

とそのエルミート共役を用いると、

\begin{align*} \Omega &\mathrel{:=} U(\rho \otimes \sigma)U^\dagger \\[0.45em] &=\sum_{x}\left(P_x\otimes U_x\right)(\rho\otimes\sigma)U^\dagger \\[0.45em] &=\sum_{x}\left(P_x\otimes U_x\right)(\rho\otimes\sigma)\sum_{x'}\left(P_{x'}\otimes U_{x'}^\dagger\right) \\[0.45em] &=\sum_{x,x'}P_x\rho P_{x'} \otimes U_x\sigma U_{x'}^\dagger \end{align*}

と書けます。

この状態において、測定器の\(Y\) と、任意物理量 \(A\) の同時確率は

p(a,y)=\mathrm{Tr}\left[(E_a \otimes Q_y)\Omega\right]

で計算できます。

先ほどの\(\Omega\) の式を代入すると、

p(a,y)=\sum_{x,x'}\mathrm{Tr}(E_aP_x\rho P_{x'})\mathrm{Tr}(Q_yU_x\sigma U_{x'}^\dagger)

前述の通り、測定器状態が識別可能ならば

Q_yU_x\sigma=\delta_{xy}U_x\sigma, \quad \sigma U_{x'}^\dagger Q_y=\delta_{x'y}\sigma U_{x'}^\dagger

という条件を満たします。(二つ目の式は一つ目の式のエルミート共役です。)
これを用いると、

\begin{align*} \mathrm{Tr}(Q_yU_x\sigma U_{x'}^\dagger)&=\mathrm{Tr}(Q_yU_x\sigma U_{x'}^\dagger Q_y) \\[0.45em] &=\delta_{xy}\delta_{x'y}\mathrm{Tr}(U_x\sigma U_{x'}^\dagger) \\[0.45em] &=\delta_{xy}\delta_{x'y} \end{align*}

となります。

したがって、同時確率は

p(a,y)=\mathrm{Tr}(E_aP_y\rho P_y)

となります。
\(Y\)の周辺確率は

\begin{align*} p(y)&=\sum_a p(a,y) \\[0.45em] &=\mathrm{Tr}\left(\sum_aE_aP_y\rho P_y\right) \\[0.45em] &=\mathrm{Tr}(P_y\rho P_y) \\[0.45em] &=\mathrm{Tr}(P_y\rho) \end{align*}

と計算できるため、条件付き確率は

\begin{align*} p(a \mid y)&=\frac{p(a,y)}{p(y)} \\[0.45em] &=\frac{\mathrm{Tr}(E_aP_y\rho P_y)}{\mathrm{Tr}(P_y\rho)} \\[0.45em] &=\mathrm{Tr}(E_a\rho_y), \\[0.45em] \rho_y&\mathrel{:=}\frac{P_y\rho P_y}{\mathrm{Tr}(P_y\rho)} \end{align*}

という式に変形できます。
最右辺を見ると、これは \(Y=y\)で条件付けられた試行における ボルンの確率規則の形になっています。
そしてこの式における量子状態

\rho_y=\frac{P_y\rho P_y}{\mathrm{Tr}(P_y\rho)}

はいわゆる射影公理を適用した場合の測定後状態になっています！

以上で射影公理の導出が完了です。

重要だったのは、非破壊な測定相互作用によって生じる測定器状態が識別可能であることと、条件付けられた試行に対する量子状態を考えることです。
この条件を満たすことで射影公理は定理となります。

逆にこれらの条件が満たされないあらゆる測定においては射影公理は成立しません。

最後に

以上の考察から、理想的な測定において自然に導出される射影公理を、あえて公理として採用することはあまり適切ではないと感じられるのではないでしょうか。

反論として、「測定装置の測定後状態は計算できないじゃないか！」というものがありますが、これは全く問題になりません。

なぜなら古典論のパートで書いたように、値を読んだだけでは状態は変化しないので、そのまま相互作用後の状態を利用できるからです。

繰り返しになりますが、量子状態とは「さまざまな物理量の確率分布を与えるソース」です。
さらに測定後状態とは、ある物理量の測定値によって条件付けられた試行における量子状態です。

このことを念頭におけば、そもそも射影公理なしに条件付き確率への乗り換えとして測定後状態を定義するのが確率論的に自然であると感じられるのではないでしょうか。