網友Rich留言:
哈囉周老師你好。想請教一個問題:eigenvalue and eigenvector 所代表的物理意義是什麼?謝謝。
答曰:
設 和
為兩向量空間,首先我們要知道線性變換
是一種數學機器,它將輸入向量
映射至輸出向量
,稱為像 (image)。對於任意
以及純量
,線性變換
滿足下列性質:
若 ,線性變換
也稱為線性算子。為方便說明,以下考慮幾何向量空間
。任一線性算子
都可用
階實矩陣
表示如下:
,
其中 。我們稱
是線性算子
的變換矩陣。
設想我們被指派擔任矩陣設計工作,第一個任務是設計對X-軸反射 (reflection,即鏡像) 的變換矩陣。對於 ,寫出
。
上式主對角矩陣即為所求。令
。
往後我們稱 為標準反射矩陣。接者考慮一般情況。令
代表一穿越原點的直線。對直線
反射的變換矩陣為何?我們從反射算子的幾何性質著手 (另一個方法是直接解出變換矩陣,見“變換矩陣的設計”)。令
表示直線
的法向量,
正交於
(見下圖)。
直線 的指向向量
和法向量
經過反射算子
的映射結果分別是
注意上面兩式具有相同型態,即
,
數學家稱純量 為線性算子
的特徵值,對應的 (非零) 向量
為特徵向量,理由是它們幾乎完全彰顯了線性算子
所隱含的固有特性。上例中,反射算子
有特徵值
和
,對應的特徵向量分別是
和
。特徵方程講述兩件事:第一,特徵向量
經反射算子
得到的像
屬於子空間
,特徵值
決定
的縮放倍數,其正負號則決定指向是否相同或相反。第二,除了特徵空間
,其他不屬於這些子空間的非零向量皆不滿足特徵方程 (否則它們也會被稱為特徵向量)。
線性算子 的特徵值和特徵向量代表甚麼物理意義呢?這個問題沒有一定的答案,原因在於不同的線性算子
具有不同的作用與功能,因此賦予特徵值和特徵向量不同的物理意義。但如果針對上例發問:定義於
的反射算子
的特徵值和特徵向量代表甚麼物理意義?答案是對應特徵值
的特徵向量
代表反射線
的指向,對應特徵值
的特徵向量
則為
的法向量。反射算子
的特徵值和特徵向量不僅明確地告訴我們
的一切作為,同時也提供了一個辨識反射變換的充要條件:(1) 特徵值是
,(2) 對應的特徵向量彼此正交。例如,標準反射矩陣
有特徵值
(主對角矩陣的主對角元即為特徵值),標準單位向量
即為對應的特徵向量。
若一反射算子 對應特徵值
的特徵向量為
,如何求出代表
的變換矩陣?數學家想出了一個聰明的辦法:藉助線性算子
的不變性來建構變換矩陣。將獨立的特徵向量組成
的一組基底
,任一向量
可唯一表示成
和
的線性組合:
,
其中組合係數 可合併成
參考基底
的座標向量,記為
。將上式代入反射算子
,利用線性變換的基本性質以及特徵方程
和
,可得
。
再寫出 參考基底
的座標向量:
。
我們得到一個令人震驚的結果:若參考特徵向量構成的基底,所有的反射矩陣必可轉換成標準反射矩陣 !剩下的工作是計算座標變換。將線性組合寫成矩陣乘法:
,
其中 稱為座標變換矩陣。因為
且
,代入上述參考基底
的座標向量映射關係,即得
。等號兩邊同時左乘
,可得
,
。
給定一變換矩陣 ,透過特徵分析,若
可分解成
,稱為對角化 (diagonalization),則
的實際作為 (或者說物理意義) 可解釋如下:因為主對角矩陣
不含耦合成分 (非主對角元),故
的特徵值
(即
的主對角元) 代表在新座標系統下第
個座標經過變換矩陣
映射後的縮放比例,對應的特徵向量
則指出新座標系統的第
軸方向。所以說,特徵分析的數學原理建立於線性變換的不變性上。