なぜ波動関数から粒子性が現れるのか？

量子力学では、「量子とは波でもあり粒子でもある」という全くよく分からなくて雑で初学者を混乱させる説明が蔓延っています。

特に有名な2重スリット実験において、波として伝わって干渉まで起こす電子が、スクリーンに当たるときは一点で検出されることに対してそのような雑な説明をしているのをよく目にします。

実際には

各事象は、粒子用の測定器を使って測定するから粒子っぽく振る舞う。
確率分布は、その微分方程式が波の方程式っぽいから波っぽく振る舞う。

と言う2つの別々の側面を見ているだけです。
とは言っても、「各事象は、粒子用の測定器を使って測定するから粒子っぽく振る舞う」って本当？？という不安も残るかと思います。

そこで本記事では、なぜ波のように伝わっていたはずなのに粒子のように一点で検出されるのか？について、簡単な測定モデルを用いて解説していきます。

状況設定

面内自由度への簡約

実際の波動関数は三次元で広がっていますが、ここではスクリーン面内の位置だけに注目したいので、スクリーン上の1自由度だけで見ていきます。

スクリーンに垂直な方向を \(y\)、面内座標を \(x\) として、

\psi(x,y,t) \approx e^{i(k_0 y-\omega t)}\phi(x)

と書くことにします。

この式は、\(y\) 方向にはほぼ決まった平面波として進み、位置情報の本体は \(x\) 方向の関数 \(\phi(x)\) に入っている、と言っているだけです。したがって、以後はスクリーンのどの場所で検出が起こるかを決める量として \(\phi(x)\) を見ればよいことになります。

スクリーンの最小模型

スクリーンを、\(N\) 個の小さな検出器からなる集合として表します。
各検出器には番号 \(j=1,\dots,N\) を振っておきます。

各検出器 \(j\) は二つの状態

|0\rangle,\qquad |1\rangle

を持つとします。\(|0\rangle\) は「まだ検出を記録していない」、\(|1\rangle\) は「その検出器が検出を記録した」と解釈することにします。

スクリーン全体の初期状態は

|00\cdots 0\rangle

です。つまり、最初はどの検出器も静かなままです。

この模型のよいところは、スクリーンという複雑な物体を「どの検出器が検出を記録したか」という離散的な情報に落とし込めることです。ここで \(j\) は粒子の量子状態の変数ではなく、スクリーン上のどこに検出器が置かれているかを表す、実験室空間に固定されたラベルです。量子的な位置分布が、最終的にこの固定されたラベル \(j\) に写されます。

スクリーンとの相互作用

次に、粒子がスクリーン上の各検出器とどう結びつくかを決めます。ここではまず、理想化したスクリーンを考えます。各検出器 \(j\) に担当領域 \(\Omega_j\) があり、それらは互いに重ならないとします。

面内座標 \(x\) を検出器幅 \(\Delta x\) で区切って、各検出器の中心を \(x_j=x_0+j\Delta x\) と書けば、たとえば

\Omega_j=\left[x_j-\frac{\Delta x}{2},x_j+\frac{\Delta x}{2}\right)

と取れます。つまり、各検出器は中心 \(x_j\) のまわりに幅 \(\Delta x\) を持つ半開区間です。

このとき、粒子の位置空間上の射影演算子

\Pi_j=\int_{x_j-\Delta x/2}^{x_j+\Delta x/2} dx|x\rangle\langle x|

を入れるのが自然です。\(\Pi_j\) は位置演算子 \(\hat x\) のスペクトルを、スクリーン側の領域分割 \(\Omega_j\) に従ってまとめたものです。
積分変数 \(x\) は粒子の量子力学的な位置変数であり、\(x_j\) はスクリーン上のどこに検出器が固定されているかを表すインデックスです。\(\Pi_j\) は、その二つをつなぐ窓の役割をしています。領域が重ならないので

\Pi_j\Pi_k=\delta_{jk}\Pi_j

が成り立ちます。

また、どの検出器にも対応しない成分をまとめて

\Pi_\perp = I-\sum_j \Pi_j

と書いておきます。

相互作用ハミルトニアンは、見通しをよくするために結合定数を共通の \(g\) として

H_{\mathrm{int}} = \sum_j g\Pi_j\otimes \sigma_j^x

とします。

ここで \(\sigma_j^x\) は検出器 \(j\) の二準位を反転させるパウリ演算子です。要するに、粒子の位置演算子 \(\hat x\) のうち領域 \(\Omega_j\) に対応する成分だけが、スクリーン上のその場所に固定された検出器 \(j\) を検出済みの状態へ回す模型になっています。見た目は単純ですが、この形にしておくと有限時間の時間発展をそのまま厳密に計算できます。

初期状態

粒子と検出器を合わせた全系の初期状態は

|\Psi(0)\rangle = |\phi\rangle \otimes |00\cdots 0\rangle

とします。

これは、「粒子は面内波動関数 \(|\phi\rangle\) で入射し、スクリーン上のどの検出器もまだ検出を記録していない」という、いちばん自然な出発点です。ここではまだ、粒子とスクリーンのあいだに相関はありません。

また、後で使うために、検出器 \(j\) だけが検出を記録した状態を

|0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0\rangle

と書いておきます。これは「検出器 \(j\) だけが検出を記録し、他の検出器はまだ何も記録していない状態」です。

検出確率

時間発展演算子の計算

では、粒子が時間 \(\tau\) だけスクリーンと相互作用したあと、状態はどうなるでしょうか。時間発展は

U(\tau)=e^{-iH_{\mathrm{int}}\tau/\hbar}

で与えられます。

ここで大事なのは、各検出器に対応する項

A_j=\Pi_j\otimes \sigma_j^x

どうしが可換になることです。実際、\(j\neq k\) なら

[A_j,A_k] = \Pi_j\Pi_k\otimes \sigma_j^x\sigma_k^x - \Pi_k\Pi_j\otimes \sigma_k^x\sigma_j^x = 0

です。前半は \(\Pi_j\Pi_k=\Pi_k\Pi_j=0\)、後半は異なる検出器に作用する \(\sigma_j^x,\sigma_k^x\) が可換であることを使っています。

したがって、

e^{-i\theta A_j} = (I-\Pi_j)\otimes I+\Pi_j\otimes e^{-i\theta\sigma_j^x}

です。さらに異なる \(j\) の射影は互いに直交しているので、これらを掛け合わせると交差項が消えます。したがって、指数関数はきれいに分解できて、\(\theta=g\tau/\hbar\) とおくと、

U(\tau) = e^{-iH_{\mathrm{int}}\tau/\hbar} = \Pi_\perp\otimes I+\sum_j \Pi_j\otimes e^{-i\theta\sigma_j^x}

です。

この式はかなり見やすいです。粒子がどの検出器の担当領域にもいない成分には何も起こらず、粒子が領域 \(\Omega_j\) にいる成分にだけ、対応する検出器 \(j\) の二準位回転

e^{-i\theta\sigma_j^x}

がかかります。

状態の時間発展

では、この \(U(\tau)\) を初期状態に作用させてみます。検出器列の初期状態 \(|00\cdots 0\rangle\) に対しては

e^{-i\theta\sigma_j^x}|00\cdots 0\rangle = \cos\theta|00\cdots 0\rangle -i\sin\theta|0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0\rangle

となります。

したがって、全系の状態は

|\Psi(\tau)\rangle = \Bigl(\Pi_\perp+\cos\theta\sum_j\Pi_j\Bigr)|\phi\rangle\otimes |00\cdots 0\rangle \\[0.45em] -i\sin\theta\sum_j \Pi_j|\phi\rangle\otimes |0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0\rangle

となります。

この式の意味ははっきりしています。最初の項は「まだどの検出器も検出を記録していない成分」、二つ目の項は「検出器 \(j\) が検出を記録した成分」です。そして、その重みを決めているのは \(\Pi_j|\phi\rangle\)、つまり粒子の波動関数のうち領域 \(\Omega_j\) に入っている部分そのものです。量子力学の側では \(\hat x\) に関する振幅だったものが、ここでは「どの場所に固定された検出器が検出を記録したか」という装置の記録へ変わっています。

検出確率の計算

検出器 \(j\) が検出を記録する確率は、\(|0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0\rangle\) 成分のノルムを取ればよいので、

\begin{aligned} &\bigl(I\otimes \langle 0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0|\bigr)|\Psi(\tau)\rangle\\[0.45em] &\qquad = -i\sin\theta\Pi_j|\phi\rangle \end{aligned}

です。最初の「まだどこも検出を記録していない」成分は直交して消え、和の中でも \(k\neq j\) の項は検出器状態が直交するので落ち、\(k=j\) の項だけが残ります。したがって、

\begin{aligned} P_j(\tau) &= \left| \bigl(I\otimes \langle 0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0|\bigr)|\Psi(\tau)\rangle \right|^2\\[0.45em] &= \sin^2\theta\langle\phi|\Pi_j^\dagger\Pi_j|\phi\rangle\\[0.45em] &= \sin^2\theta\langle\phi|\Pi_j|\phi\rangle \\[0.45em] &=\sin^2\theta \int_{x_j-\Delta x/2}^{x_j+\Delta x/2} dx|\phi(x)|^2 \end{aligned}

です。最後の等号では \(\Pi_j\) が射影演算子なので \(\Pi_j^\dagger=\Pi_j\)、\(\Pi_j^2=\Pi_j\) を使いました。

さらに、検出器幅 \(\Delta x\) が十分小さい時、

P_j(\tau)\propto |\phi(x_j)|^2\Delta x

と計算できます。
この結果から、量子的な位置の確率変数 \(\hat x\) の分布が、スクリーン上に固定された古典的な位置座標 \(x_j\) ごとの検出確率に転写されていることが確認できます。

そして重要なのは、スクリーン上の異なる検出器が同時に検出を記録することはないという点です。
状態

|\Psi(\tau)\rangle=\Bigl(\Pi_\perp+\cos\theta\sum_j\Pi_j\Bigr)|\phi\rangle\otimes |00\cdots 0\rangle \\[0.45em] -i\sin\theta\sum_j \Pi_j|\phi\rangle\otimes |0\cdots 0\overset{\scriptstyle j\text{番目}}{1}0\cdots 0\rangle

の中には二つ以上の検出器が同時に検出を記録した成分が最初から現れていません。したがって、理想模型では\(j\)と\(k\)の同時検出確率\(P_{jk}\)は

P_{jk}=0\qquad (j\neq k)

となります。

すなわち一回の試行で検出を記録する検出器は高々一つです。

以上の結果は、なめらかに分布する波であるはずの波動関数からなぜ離散的な点粒子のような観測結果が得られるのかの答えになっています。

まず、波動関数が持っていた量子的な位置の分布が古典的なスクリーン座標ごとの検出確率に焼き直されることで離散的な事象として検出できます。
さらにその検出が異なる座標上で重複検出されないことから単一の点粒子のように見えます。

ここで重複検出が起きないのはそうなるようにモデルを選んだだけではないのか？という疑問が浮かびます。
実際その通りで、重複検出をするモデルもあり得ます。
それでもまともに局所的に相互作用するものとしてモデルを作れば、離れた点での重複検出はほとんど起きないことが示せます。

記事の宣伝

突然ですが宣伝です！他にも面白い記事を読みたい方はマガジンも見てみてください！

それでは続きをお楽しみください。

重複検出を許す拡張

ここまでのモデルでは、検出器の検出領域に重なりがないという性質

\Pi_j\Pi_k=\delta_{jk}\Pi_j

を仮定していました。
この仮定はスクリーンと量子の相互作用が局所的であるという妥当なものですが、現実の検出器はそこまで理想的ではありません。
隣り合う検出器の感度領域が少し重なることもあります。その場合は、もう \(\Pi_j\) のようなきれいな直交射影だけでは書けず、窓関数 \(\chi_j(x)\) を使って

H_{\mathrm{int}} = \sum_j g_j\chi_j(\hat x)\sigma_j^x

の形へ戻るのが自然です。ここからは、各検出器が同じ形の感度窓を平行移動したものになっているとして

\chi_j(x)=\chi(x-x_j),\qquad g_j=g

を仮定します。

ここで大事なのは、この場合でも各項は可換だということです。実際、\(\chi_j(\hat x)\) と \(\chi_k(\hat x)\) は同じ位置演算子 \(\hat x\) の関数なので可換であり、異なる検出器に作用する \(\sigma_j^x,\sigma_k^x\) も可換です。したがって

[\chi_j(\hat x)\otimes \sigma_j^x,\chi_k(\hat x)\otimes \sigma_k^x]=0

です。

したがって、時間発展はここでも近似なしで

U(\tau) = \prod_j \exp\left(-\frac{i\tau}{\hbar}g\chi_j(\hat x)\sigma_j^x\right)

と分解できます。位置表示で

\theta_j(x)=\alpha\chi(x-x_j),\qquad \alpha=\frac{g\tau}{\hbar}

とおくと、各位置 \(x\) で検出器状態は

\bigotimes_j \Bigl(\cos\theta_j(x)|0\rangle -i\sin\theta_j(x)|1\rangle\Bigr)

へ回転します。したがって、全系の状態は

|\Psi(\tau)\rangle = \int dx\phi(x)|x\rangle\otimes \bigotimes_j \Bigl(\cos\theta_j(x)|0\rangle -i\sin\theta_j(x)|1\rangle\Bigr)

と厳密に書けます。

この式を見ると、重なりがある領域では一つの位置 \(x\) に対して複数の \(\theta_j(x)\) が同時に非ゼロになり、そのぶん複数の検出器が一緒に回転することが分かります。つまり、重複検出は近似の産物ではなく、この模型の有限時間発展の中に最初から入っています。

たとえば、検出器 \(j,k\) が同時に検出を記録し、他の検出器は何も記録しない確率は厳密に

P_{jk}(\tau) = \int dx|\phi(x)|^2\sin^2\theta_j(x)\sin^2\theta_k(x)\prod_{\ell\neq j,k}\cos^2\theta_\ell(x)

です。

この厳密式から、検出器 \(j,k\) が離れると二重検出が抑えられることも、そのまま読み取れます。実際、

0\le \prod_{\ell\neq j,k}\cos^2\theta_\ell(x)\le 1, \qquad \sin^2\theta_j(x)\le \theta_j(x)^2, \qquad \sin^2\theta_k(x)\le \theta_k(x)^2

を使うと、

P_{jk}(\tau) \le \int dx|\phi(x)|^2\theta_j(x)^2\theta_k(x)^2 \le \alpha^4\left(\sup_x\chi(x-x_j)\chi(x-x_k)\right)^2

となります。
この評価により、検出器 \(j\) と \(k\) の感度の重なりが二重検出の確率を決めていることが分かります。
理想模型の場合には、この重なりが0だったために、重複が起きていなかったと理解できます。

ただし、少しでも重なりがあれば離れた点でも重複検出が起きるというわけではありません。

たとえば、感度窓がガウス型

\chi_j(x)=\exp\left[-\frac{(x-x_j)^2}{4\sigma^2}\right]

なら

P_{jk}(\tau) \le \left(\frac{g\tau}{\hbar}\right)^4\exp\left[-\frac{(x_j-x_k)^2}{4\sigma^2}\right]

と評価できます。
つまり、ガウス型の感度を持つスクリーンでは、二重検出確率は検出器間距離 \(|x_j-x_k|\) に対して指数的に急激に減衰します。
従って仮に重複検出が起きたとしても、それは検出窓が重なるくらい近い二つの点であり、マクロには一点として検出されたように見えるはずです。

まとめ

この記事で見たかったのは、波のように広がった波動関数に従う量子が、なぜ測定では点粒子のように現れるのか、という点でした。

まず理想模型では、粒子の位置分布はスクリーン上の各検出器の検出確率

P_j(\tau)\propto |\phi(x_j)|^2\Delta x

へ写され、しかも一回の試行で検出を記録する検出器は高々一つでした。したがって、1回ごとの観測結果は局所的な一点検出として現れ、試行をたくさん重ねたときにだけ波動関数の広がりが統計として見えてきます。

この議論は一見すると波動関数が持っていた分布をスクリーンに移し替えただけで問題をスクリーンに押し付けただけに見えるかもしれません。
しかし、スクリーン上の検出器の感度領域が重なれば、位置をうまく検出するのに二重検出を起こしてしまうモデルも作れます。
つまり、波動関数に従う量子が点として観測されるのは、スクリーン上で局所的に相互作用する検出器を使っているからだと解釈できるわけです。

量子が点として観測されるのは「本当は最初から点だったから」ではありません。
波動関数が与えるのはどこで検出が起こりやすいかという情報であり、波動関数と局所的に相互作用して状態を変化させられた検出器が点での結果を吐き出すのです。