量子トンネル効果はなぜ起きるのか？

先に不思議がるべきことがあるはず

トンネル効果は不思議だと言われることが多い。
しかしそもそもポテンシャルの壁の働きが古典的直感と本当に同じなのか？と言った点がクリアになる前にトンネル効果を不思議がって良いのだろうか。(いや、良くない)

量子力学では運動エネルギーとポテンシャルエネルギーは同時に定まった値を持たないという古典的直感とは相容れない概念になっている。
それなのになぜ \(V(x)\) は古典力学のポテンシャルのように粒子を押し戻したり引き寄せたりするのだろうか。

古典力学では保存される量は

E=\frac{p^2}{2m}+V(x)

であり、最初に持っていた運動エネルギーより高い位置エネルギーの場所には行けない。したがって、ポテンシャルの壁が壁になることはすぐに分かる。

一方で量子力学で保存されるのは、各瞬間に \(\frac{p^2}{2m}+V(x)\) が成り立つという意味ではなく、ハミルトニアン演算子

H=-\frac{\hbar^2}{2m}\frac{\partial^2}{\partial x^2}+V(x)

である。すると量子力学に現れる \(V(x)\) が、なぜ古典的なポテンシャルと同じ向きに運動を曲げるのかは自明ではない。

この記事では、トンネル効果を正当に不思議がる資格を得るために、「量子力学のポテンシャルはどうしてポテンシャルらしく働くのか」を、時間発展の細かいステップに分けて見ていく。

時間発展を離散化する

見やすさのために \(\hbar=1\) とおく。時間依存 Schrödinger 方程式は

i\frac{\partial\psi}{\partial t}=\left(-\frac{1}{2m}\frac{\partial^2}{\partial x^2}+V(x)\right)\psi

である。ハミルトニアンを

H=T+V,\qquad T=-\frac{1}{2m}\frac{\partial^2}{\partial x^2}

と分ける。ここで有限時間 \(t\) を \(N\) 分割し、短い時間幅 \(\Delta t=t/N\) を導入する。このとき Trotter の積公式

e^{-iHt}=\lim_{N\to\infty}\left(e^{-iT\Delta t}e^{-iV\Delta t}\right)^N

が成り立つ。

ここで大事なのは、量子力学の時間発展全体が、短い時間ごとの二種類の操作の反復として理解できることである。つまり

e^{-iHt}=e^{-iT\Delta t}e^{-iV\Delta t}\cdots e^{-iT\Delta t}e^{-iV\Delta t}

という極限として、時間発展を「運動エネルギーステップ」と「ポテンシャルステップ」の積み重ねで見る。

まずポテンシャルステップでは、波動関数は

\psi(x)\mapsto e^{-iV(x)\Delta t}\psi(x)

と変化する。これは位置ごとに異なる位相回転を与えるだけなので、位置表示での確率密度 \(|\psi(x)|^2\) は変わらない。したがって、このステップで直接変わるのは位置分布ではなく運動量分布である。

逆に運動エネルギーステップでは、運動量表示で

\tilde\psi(p)\mapsto e^{-i\frac{p^2}{2m}\Delta t}\tilde\psi(p)

と変化する。こちらは運動量ごとの位相回転なので、運動量分布 \(|\tilde\psi(p)|^2\) は変わらない。変わるのは位置分布である。

したがって時間発展は、次の二つが交互に起きる過程として見られる。

ポテンシャルステップ: ポテンシャルに応じて運動量分布を更新する
運動エネルギーステップ: その運動量分布に応じて位置分布を更新する

冒頭で見せたシミュレーション↓は、青線がステップで離散化した計算結果で、黄色が厳密解である。

このシミュレーションを見る限り、ステップで分解して近似しても問題なく現象を調べられそうである。

ポテンシャルを区分的に直線で近似する

解釈しやすくするために、ポテンシャルを区分的に直線とみなす。

具体的には、\(x\) 軸を細かい区間 \([x_j,x_{j+1}]\) に分け、各端点 \(\left(x_j,V(x_j)\right)\) と \(\left(x_{j+1},V(x_{j+1})\right)\) を直線で結ぶことで、全体を折れ線ポテンシャル \(V^{\mathrm{lin}}(x)\) で近似する。

V(x)\approx V^{\mathrm{lin}}(x)

各区間ではこの折れ線は

V^{\mathrm{lin}}(x)=V_j-F_j x

と書ける。ここで \(V_j\) と \(F_j\) は定数で、\(F_j\) はその区間での力に対応する。言い換えると、なめらかなポテンシャルを短い区間ごとの「一定の傾き」に分解して考えるわけである。

区間ごとのポテンシャルステップを見る

次に、この区間分割に合わせて波動関数を分ける。時刻を

t_n=n\Delta t,\qquad n=0,1,\dots,N

と刻み、各ステップごとに波動関数を

\psi(x)=\sum_j \psi_j(x),\qquad \psi_j(x)=\chi_j(x)\psi(x)

と分解する。ここで \(\chi_j(x)\) は区間 \([x_j,x_{j+1}]\) で 1、それ以外で 0 となる関数である。波動関数を、区間ごとの短冊状の成分の重ね合わせとして見るイメージである。

時間 \(\Delta t\) の一回のポテンシャルステップでは位置分布は変わらない。したがってこの短い時間に限れば、区間外で 0 となる \(\psi_j\) に対しては、その区間の中でポテンシャルが

V^{\mathrm{lin}}(x)=V_j-F_j x

となっているとしてよい。従って \(j\) 番目の成分に対するポテンシャルステップは

\psi_j(x)\mapsto e^{-i\left(V_j-F_j x\right)\Delta t}\psi_j(x)

となる。

これを運動量表示で見るために、

\psi_j(x)=\frac{1}{\sqrt{2\pi}}\int \tilde\psi_j(p)e^{ipx}dp

と書く。すると

e^{-i\left(V_j-F_j x\right)\Delta t}\psi_j(x)=\frac{e^{-iV_j\Delta t}}{\sqrt{2\pi}}\int \tilde\psi_j(p)e^{iF_j x\Delta t}e^{ipx}dp

となるので、指数をまとめれば

e^{-i\left(V_j-F_j x\right)\Delta t}\psi_j(x)=\frac{e^{-iV_j\Delta t}}{\sqrt{2\pi}}\int \tilde\psi_j(p)e^{i(p+F_j\Delta t)x}dp

と書ける。ここで \(p'=p+F_j\Delta t\) と置換すると、

e^{-i\left(V_j-F_j x\right)\Delta t}\psi_j(x)=\frac{e^{-iV_j\Delta t}}{\sqrt{2\pi}}\int \tilde\psi_j(p'-F_j\Delta t)e^{ip'x}dp'

を得る。したがって運動量表示では

\tilde\psi_j(p)\mapsto e^{-iV_j\Delta t}\tilde\psi_j(p-F_j\Delta t)

となる。

この式はポテンシャルステップが区間 \(j\) において運動量分布を

\Delta p_j=F_j\Delta t

だけ平行移動するということを意味する。しかも区間内では \(F_j=-\frac{dV^{\mathrm{lin}}}{dx}\approx -\frac{dV}{dx}\) なので、これはちょうど「運動量変化 = 力 × 時間」という古典力学の形になっている。

つまり量子力学のポテンシャルは、局所的にはその傾きに応じた力積を古典力学と同じように与えることがわかる。

全体の波動関数でも大体同じ

ここまでは各区間の成分 \(\psi_j\) に対して議論した。では全体の波動関数では何が起きるのか。各成分を足し合わせると、全体の運動量波動関数は

\tilde\psi(p)\mapsto \sum_j e^{-iV_j\Delta t}\tilde\psi_j(p-F_j\Delta t)

となる。つまり各区間の成分が、それぞれ異なる力積 \(F_j\Delta t\) を受けて平行移動したものの重ね合わせになる。

ここで \(e^{-iV_j\Delta t}\) は残るが、これは干渉縞を与えるだけで、本質的に運動量分布を左右にずらしたり幅を変えたりはしない。

したがって、たとえばすべての区間で力 \(F_j\) が同じ向きなら、

\Delta p_j=F_j\Delta t

によって各成分の運動量分布は力の向きに揃ってずらされる。
以上から、元の波動関数においてもポテンシャルは古典論と同じように「力」を及ぼすものとして解釈できることが確認できた。

そしてトンネル効果はなぜ起こるのか

ここまでの議論によって、ポテンシャルが古典的なポテンシャルと同じような働きをすることが理解できた。従ってようやくトンネル効果を不思議がる資格が得られたわけである。ではなぜトンネル効果は起きるのだろうか？

ポテンシャルを\(V(x)\)とし、

F(x):=-\frac{dV}{dx}(x)\leq0

となる場合を考える。
すなわち、1次元空間上を負の方向に力がかかるポテンシャルの障壁がある状況を想定する。

正の方向に移動する波束をこのポテンシャルにぶつけてみる。
古典論の場合、粒子は運動エネルギーを消費してポテンシャルエネルギーに変換しながらこの坂を登っていく。
そして運動エネルギーが尽き、正の運動量が尽きた地点で引き返して坂を下っていく。
上式から、量子でも同じようにポテンシャルの坂によって運動量が削られていくことが分かるので、量子の波束の最高到達点として、正の運動量分布が尽きた瞬間を採用し、その直後に何が起きるのかを調べると良さそうである。
古典論であればこれ以上は正の方向には進まないため、仮に少しでも右に染み出す成分があればそれはトンネル効果の現れと捉えられる。

数式で表すと、正の運動量の確率が

P_+(t):=\int_0^\infty |\tilde\psi(p,t)|^2dp=0

となったと仮定し、この次のステップを調べる。
運動量分布を変化させる役割はポテンシャルステップであり、それによってこの条件が達成されたはずなので、次のステップは運動エネルギーステップ

\tilde\psi(p)\mapsto e^{-i\frac{p^2}{2m}\Delta t}\tilde\psi(p)

である。このステップでは運動量分布そのものは変わらない。つまり \(P_+(t)=0\) のままなので、直感的には正の方向に運動する要因はないように見える。
では実際に正の方向への流れがあるかどうかを確認してみる。

位置が\(x\geq a\)となる確率は

Q_a(t)=\int_a^\infty |\psi(x,t)|^2dx

と計算でき、その時間変化は

\frac{dQ_a}{dt}=j(a,t),\quad j(x,t):=\frac{1}{m}\mathrm{Im}\left(\psi^*(x,t)\partial_x\psi(x,t)\right)

となる。したがって、たとえ正の運動量成分が消えていても、もし \(j(x,t)>0\) となる場所があれば、それがトンネル効果の兆候である。

確率流\(j(x,t)\)を運動量表示で書くと

j(x,t)=\frac{1}{4\pi m}\int_{-\infty}^0\int_{-\infty}^0 dp dq (p+q)e^{i(q-p)x}\tilde\psi^*(p,t)\tilde\psi(q,t)

となる。対角成分 \(p=q\) だけを見れば運動量の符号に沿った流れになりそうだが、位相因子\(e^{i(q-p)x}\) が流れの向きをひっくり返しうる。
そうすると\(j(x,t)>0\)となる点が現れ、これがトンネル効果を発生させていると考えられる。

まとめ

本記事ではトンネル効果を正当に不思議がることを目標にした。
まずはポテンシャルが本当に古典的な壁の働きをし得るのかを考察し、おおよそ古典的な働きをすることを確認した。
その上でトンネル効果がなぜ起きるのかを深掘りし、それが量子特有の位相因子に由来することを突き止めた。

しかしこれで本当にトンネル効果を理解できたと言えるのだろうか？
位相因子があるからそりゃそうだよね、となる人はいるのだろうか？
結局は位置と運動量、あるいはポテンシャルエネルギーと運動エネルギーが同時確率分布を持てない、ということ以上のことは分からないのかもしれない。
一般に量子論では物理量の値の保存則はなく、分布の保存則があるのみである。
その視点で見れば、トンネル効果も別に不思議ではないのかもしれない。