量子力学の入門でつまずく理由のひとつは、「なぜ急に波動関数や演算子が出てくるのか」が見えにくいことにあると思います。
期待値という最もなじみのある式から出発すると、量子は古典確率とまったく別の世界なのではなく、「可換な世界を非可換へと延長したもの」として、かなり自然に理解できるようになります。

ここでは、話を有限次元に限ります。無限次元の厳密な議論はいったん脇に置き、「量子をどう見ると入りやすいか」をつかむことだけを目標にします。

この記事の結論
古典確率では、期待値は「同じ基底で対角な行列どうし」のトレースとして書けます。
その式が期待値として成り立つための基底に依らない条件だけを残し、同時対角化可能性を外すと量子論が現れます。

古典期待値を行列で書いてみる

たとえば、ある量が n 通りの値を取り、それぞれの観測値が \(a_{1}\), \(a_{2}\), ..., \(a_{n}\)、対応する確率が \(p_{1}\), \(p_{2}\), ..., \(p_{n}\) だとします。古典確率の期待値はもちろん

古典期待値

\[\mathbb{E}[a] = \sum_i a_i p_i\]

ですが、これを対角行列で書き直すと見通しが一気によくなります。観測値を並べた行列 \(\left[A\right]\) と、確率分布を並べた行列 \(\left[\rho\right]\) を

対角行列としての古典データ

\[\left[A\right] = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix}, \qquad \left[\rho\right] = \begin{pmatrix} p_1 & 0 & \cdots & 0 \\ 0 & p_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & p_n \end{pmatrix}\]

と置くと、期待値は次のように書けます。

トレースで書いた期待値

\[\sum_i a_i p_i = \operatorname{Tr}(\left[A\right]\left[\rho\right])\]

これはただの書き換えに見えるかもしれません。ですが、この書き換えが決定的に重要です。ここで、行列 \(\left[A\right], \left[\rho\right]\) を、複素内積空間 \(\mathbf{C}^n\) から \(\mathbf{C}^n\) への線型変換 \(A, \rho\) の基底表示だと考えてみます。さらに、 \(\operatorname{Tr}(\left[A\right]\left[\rho\right])\) という形に注目すると、行列の対角成分の和として定義されたトレースが、線型写像に対しても基底に依らずきちんと定まります。

したがって、線型写像そのもののレベルでは、この量を \(\operatorname{Tr}(A\rho)\) と書けます。ここでいう \(\operatorname{Tr}(A\rho)\) は、行列 \(\operatorname{Tr}(\left[A\right]\left[\rho\right])\) で計算される値を、基底に依らない線型写像の量として表したものです。

以後は、 \(\mathbf{C}^n\) から \(\mathbf{C}^n\) への線型変換を \(A, \rho\) と書き、ひとつ固定した正規直交基底で表したその行列を \(\left[A\right], \left[\rho\right]\) と書くことにします。

条件を基底によらない形に言い換える

まず対角行列 \(\left[A\right], \left[\rho\right]\) に必要な条件をそのまま書き出します。期待値 \(\sum_i a_i p_i\) が期待値として自然に振る舞うためには、観測量を表す \(\left[A\right]\) については対角成分が実数であること、状態を表す \(\left[\rho\right]\) については対角成分が非負で、さらにトレースが 1 であることが必要です。

次に、この条件を基底に依らない形へ順に言い換えていきます。ここでの狙いは、「対角行列であること」そのものを残すことではなく、どの正規直交基底で見ても意味が通る条件だけを取り出すことです。

まず、観測量を表す線型変換 \(A\) について考えます。先に、複素内積空間 \(\mathbf{C}^n\) 上の線型変換 \(A:\mathbf{C}^n\to\mathbf{C}^n\) のエルミート共役 \(A^\dagger\) を

\[\langle x,Ay\rangle = \langle A^\dagger x,y\rangle \qquad (\forall x,y\in\mathbf{C}^n)\]

を満たす線型変換として定義します。これは内積から定まる概念で、基底を選ぶ前に定義されています。

つぎに、これを正規直交基底で行列表示すると、どのような形になるかを調べます。正規直交基底をひとつ固定し、 \(\left[A\right] = (A_{ij})\) とします。基底ベクトルを \(e_i, e_j\) とすると、

\[A_{ij} = \langle e_i, A e_j\rangle\]

です。一方、エルミート共役の定義から

\[\langle e_i, A e_j\rangle = \langle A^\dagger e_i, e_j\rangle\]

となります。複素内積では \(\langle u,v\rangle = \langle v,u\rangle^*\) なので、

\[\langle A^\dagger e_i, e_j\rangle = \langle e_j, A^\dagger e_i\rangle^*\]

ですが、 \(\langle e_j, A^\dagger e_i\rangle\) は \(\left[A^\dagger\right]\) の \((j,i)\) 成分です。したがって

\[\left[A^\dagger\right]_{ji} = A_{ij}^*\]

すなわち \(\left[A^\dagger\right]\) は \(\left[A\right]\) を複素共役して転置したものです。これを行列の記号で \(\left[A\right]^\dagger\) と書くことにします。こうして行列に対する \(\dagger\) が定まりました。

そのうえで、古典の場合の \(\left[A\right]\) は対角行列

\[\left[A\right] = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix}, \qquad a_i \in \mathbf{R}\]

です。したがって、この基底では

\[\left[A\right]^\dagger = \begin{pmatrix} a_1^* & 0 & \cdots & 0 \\ 0 & a_2^* & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n^* \end{pmatrix} = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix} = \left[A\right]\]

となります。したがって \(\left[A^\dagger\right] = \left[A\right]\) であり、 \(A^\dagger = A\) です。この性質をエルミート性、あるいは自己共役性と呼びます。したがって、 \(\left[A\right]\) の対角成分が実数であるという条件は、基底に依らない形では \(A^\dagger = A\) と言い換えられます。逆に、 \(\left[A\right]\) が対角行列で \(A^\dagger = A\) なら \(\left[A\right]^\dagger = \left[A\right]\) なので、各対角成分は \(a_i^* = a_i\) を満たし、したがって実数です。

次に状態を表す \(\left[\rho\right]\) を見ます。古典確率の条件は

\[\left[\rho\right] = \begin{pmatrix} p_1 & 0 & \cdots & 0 \\ 0 & p_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & p_n \end{pmatrix}, \qquad p_i \ge 0,\qquad \sum_{i=1}^n p_i = 1\]

です。トレースについてはすでに基底に依らない量として定義できているので、

\[\operatorname{Tr}\left[\rho\right] = \sum_{i=1}^n p_i = 1 \qquad\Longleftrightarrow\qquad \operatorname{Tr}\rho = 1\]

とそのまま言い換えられます。残る非負性は、任意の \(x=(x_1,\dots,x_n)\in\mathbf{C}^n\) に対して

\[\langle x,\rho x\rangle = x^\dagger \left[\rho\right] x = \sum_{i=1}^n p_i |x_i|^2 \ge 0\]

と書ける、という形で表れています。そこで一般の線型変換 \(\rho:\mathbf{C}^n\to\mathbf{C}^n\) に対して、 任意の \(x\in\mathbf{C}^n\) について \(\langle x,\rho x\rangle \ge 0\) が成り立つとき \(\rho \ge 0\) と書き、これを半正定値と定義します。対角行列 \(\left[\rho\right]\) の場合には、この条件はちょうどすべての対角成分 \(p_i\) が非負であることと同値です。実際、 \(p_i \ge 0\) なら上の式から \(\langle x,\rho x\rangle \ge 0\) が従い、逆に \(\rho \ge 0\) なら標準基底ベクトル \(e_i\) を代入して \(p_i = \langle e_i,\rho e_i\rangle \ge 0\) を得ます。

以上をまとめると、古典の対角行列に課していた条件

\[\left[A\right] \text{ の対角成分は実数},\qquad \left[\rho\right] \text{ の対角成分は非負},\qquad \operatorname{Tr}\left[\rho\right]=1\]
\[\Longleftrightarrow\]
\[A^\dagger = A,\qquad \rho \ge 0,\qquad \operatorname{Tr}\rho = 1\]

という基底によらない条件に、ちょうど言い換えられます。この整理のよいところは、「古典の条件を座標依存な形で覚える」のではなく、「期待値という概念が壊れないための条件」として読めることです。

元に戻れるかの確認

さらに、観測量 \(A\) がエルミートであるときには、もとの古典的な期待値の形 \(\sum_i a_i p_i\) も、基底を固定せずに取り戻せます。そのためにスペクトル分解定理を使います。

まず用語を定義します。
零でないベクトル \(\psi \in \mathbf{C}^n\) が \(A\psi = a\psi\) を満たすとき、 \(a\) を \(A\) の固有値、 \(\psi\) をその固有ベクトルと呼びます。また、その固有値 \(a\) に属する固有ベクトル全体と 0 ベクトルを合わせた部分空間を、固有空間と呼びます。

ついでに、部分空間 \(E \subset \mathbf{C}^n\) への直交射影とは、各ベクトルをその部分空間への直交成分に写す線型変換のことです。これを \(P\) と書くと、 \(P^\dagger = P\) かつ \(P^2 = P\) を満たします。

以下のスペクトル分解定理が成立します。

\[A^\dagger = A \quad\Longrightarrow\quad A = \sum_{i=1}^m a_i P_i\]

ここで \(a_1,\dots,a_m\) は \(A\) の相異なる固有値で、いずれも実数です。 \(P_i\) は固有空間 \(E_{a_i}\) への直交射影で、

\[P_iP_j = 0 \ (i\neq j),\qquad \sum_{i=1}^m P_i = I\]

を満たします。これは、エルミートな観測量は適切な正規直交基底を取れば対角に見える、という事実を基底に依らない形で書いたものです。

このスペクトル分解を期待値の式に代入すると、

\[\operatorname{Tr}(\rho A) = \operatorname{Tr}\left(\rho \sum_{i=1}^m a_i P_i\right) = \sum_{i=1}^m a_i, \operatorname{Tr}(\rho P_i)\]

となります。そこで

\[p_i := \operatorname{Tr}(\rho P_i)\]

と置けば、これはちょうど \(\sum_i a_i p_i\) の形です。しかも \(p_i\) は確率として読めます。実際、 \(\rho \ge 0\) と \(P_i \ge 0\) から \(\operatorname{Tr}(\rho P_i)\ge 0\) であり、また

\[\sum_{i=1}^m p_i = \sum_{i=1}^m \operatorname{Tr}(\rho P_i) = \operatorname{Tr}\left(\rho \sum_{i=1}^m P_i\right) = \operatorname{Tr}(\rho I) = \operatorname{Tr}\rho = 1\]

です。したがって、エルミートな観測量 \(A\) に対しては、基底を固定しなくても、そのスペクトル分解 \(A=\sum_i a_iP_i\) を使うことで、期待値は \(\operatorname{Tr}(\rho A)=\sum_i a_i p_i\) という古典的な形に戻せます。

複数の物理量の期待値は?

ここまでは物理量を一つだけ見てきました。次は、二つの物理量 \(A, B\) を同時に扱うとき、何が本質なのかを見ます。まずは対角行列のレベルから始めます。

古典では、ある正規直交基底をうまく選ぶと、二つの物理量の行列表現 \(\left[A\right], \left[B\right]\) をどちらも対角行列にできます。これを \(A\) と \(B\) が同時対角化できる、と言います。そのとき

\[\left[A\right] = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix}, \qquad \left[B\right] = \begin{pmatrix} b_1 & 0 & \cdots & 0 \\ 0 & b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & b_n \end{pmatrix}\]

と書けます。このとき、同じ確率分布 \(p_i\) を並べた状態の行列 \(\left[\rho\right]\) に対して、二つの期待値は

\[\langle A\rangle = \operatorname{Tr}\left(\left[\rho\right]\left[A\right]\right) = \sum_i a_i p_i, \qquad \langle B\rangle = \operatorname{Tr}\left(\left[\rho\right]\left[B\right]\right) = \sum_i b_i p_i\]

と、同じ形で並べて書けます。つまり、ひとつの古典確率分布の上で二つの物理量を同時に扱えているわけです。

ところが、ここまでの条件式だけを見ると、 \(A^\dagger = A,\ B^\dagger = B\) で、一見 \(A\) と \(B\) の間には何の制約もないように見えます。しかし、古典の話を本当に言い換えるなら、「ある正規直交基底で \(\left[A\right], \left[B\right]\) が同時に対角になる」という条件を添えなくてはいけません。

この条件は、線型変換の言葉ではきれいに \(AB = BA\) という必要十分条件に言い換えられます。まず、同時対角化できるなら可換であることはすぐに分かります。実際、同じ基底で

\[\left[A\right] = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix}, \qquad \left[B\right] = \begin{pmatrix} b_1 & 0 & \cdots & 0 \\ 0 & b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & b_n \end{pmatrix}\]

なら

\[\left[A\right]\left[B\right] = \begin{pmatrix} a_1b_1 & 0 & \cdots & 0 \\ 0 & a_2b_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_nb_n \end{pmatrix} = \left[B\right]\left[A\right]\]

なので \(AB = BA\) です。

逆に、 \(A\) と \(B\) がエルミートで、しかも \(AB = BA\) だとします。このとき \(A\) の固有値 \(a\) に属する固有空間を \(E_a\) とすると、任意の \(v\in E_a\) に対して

\[A(Bv) = B(Av) = B(av) = a(Bv)\]

なので \(Bv \in E_a\) です。つまり、 \(B\) は \(A\) の各固有空間を保ちます。したがって、 \(B\) を各 \(E_a\) に制限して考えられますが、その制限もやはりエルミートです。そこで、各固有空間 \(E_a\) の中で \(B\) の固有ベクトルからなる正規直交基底を取ることができます。それらを全部合わせると、 \(A\) と \(B\) の共通固有ベクトルからなる \(\mathbf{C}^n\) の正規直交基底が得られます。したがって \(A\) と \(B\) は同時対角化できます。

二つのエルミート観測量の同時対角化条件

\[A^\dagger = A,\quad B^\dagger = B\]
\[A,B \text{ が同時対角化できる} \quad\Longleftrightarrow\quad AB = BA\]

ここで大事なのは、可換性が問題になるのは観測量どうしの間だということです。状態 \(\rho\) については、 \(A\) や \(B\) と可換である必要はありません。

実際、 \(A\) の固有基底を取ると

\[\left[A\right] = \begin{pmatrix} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{pmatrix}, \qquad \left[\rho\right] = \begin{pmatrix} \rho_{11} & \rho_{12} & \cdots & \rho_{1n} \\ \rho_{21} & \rho_{22} & \cdots & \rho_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \rho_{n1} & \rho_{n2} & \cdots & \rho_{nn} \end{pmatrix}\]

なので

\[\operatorname{Tr}\left(\left[\rho\right]\left[A\right]\right) = a_1\rho_{11} + a_2\rho_{22} + \cdots + a_n\rho_{nn}\]

となり、期待値に現れるのは \(\left[\rho\right]\) の対角成分だけで、非対角成分 \(\rho_{ij}\ (i\neq j)\) はこの段階では寄与しません。したがって、ここでは \(\rho\) と \(A, B\) の可換性は、あってもなくてもかまいません。

すると次に気になってくるのは、観測量どうしについて、この条件 \(AB=BA\) をあえて外すと何が起こるのか、ということです。そこから先が、まさに量子らしい拡張です。

量子力学の非可換性

ここまで来ると、次に見たくなるのは期待値だけでなく、「ばらつき」です。観測量 \(A\) のスペクトル分解 \(A=\sum_i a_iP_i\) に対して、状態 \(\rho\) における確率 \(p_i=\operatorname{Tr}(\rho P_i)\) を使えば、分散を

\[(\Delta_\rho A)^2 := \sum_i (a_i-\langle A\rangle)^2 p_i\]

と定義できます。これは古典確率での分散そのものです。さらに、トレースで書けば

\[(\Delta_\rho A)^2 = \operatorname{Tr}\left(\rho (A-\langle A\rangle I)^2\right)\]

となります。同様に \(B\) の分散 \((\Delta_\rho B)^2\) も定義できます。

古典の範囲、つまり \(A\) と \(B\) が同時対角化できる場合には、共通固有ベクトル \(\psi\) をひとつ取り、その張る 1 次元部分空間への直交射影を \(\rho\) に選べば、 \(A\psi = a\psi,\ B\psi=b\psi\) なので

\[\Delta_\rho A = 0,\qquad \Delta_\rho B = 0\]

にできます。つまり、可換な古典の世界では、状態をうまく選べば二つの物理量を同時にまったくぶれなく測れます。

では、ここで \(AB=BA\) という条件だけを外してみます。実は、この「観測量が非可換である」というたった一つの拡張だけで、量子力学の核心に触れられます。なぜなら、この拡張によって分散の積に下限が生まれるからです。

交換子を \([A,B] := AB-BA\) と定義すると、量子力学では

不確定性関係

\[\Delta_\rho A \Delta_\rho B \ge \frac{1}{2} \left| \operatorname{Tr}\left(\rho [A,B]\right) \right|\]

が成り立ちます。これが不確定性原理の基本形です。右辺は \([A,B]\) が 0 なら消えますが、非可換なら一般には 0 ではありません。したがって、非可換な観測量に対しては、古典のように分散を自由に同時 0 にすることはできず、同時に鋭く定められない状況が現れます。

よく知られている不確定性原理は、まさにこのことです。古典から外した条件は \(AB=BA\) ただ一つでした。そして、そのたった一つの変更から、量子力学らしい非古典的な性質がはっきり現れます。

まとめ

古典期待値の構造を線形代数に乗せることで、基底によらない形式に移し替え、最後に非可換性を導入することで量子力学が現れることを見ました。
スペクトル分解を使えば、期待値や分散はいつでも古典的な和の形に戻れます。
しかし、観測量どうしが非可換になると、それらを同じ古典確率分布の上で同時に扱うことはできなくなり、そのことが不確定性原理を含む量子の性質として現れるわけです。