自相關函數(auto-correlation function)、自共變異數(auto-covariance)與變異數(variance)
在數據分析的世界裡,我們經常問一個問題:「現在發生的事,跟過去有關聯嗎?」要回答這個問題,最強大的工具就是自相關函數 (autocorrelation function)。
一. 什麼是自相關?(從「相似度」出發)
想像你在聽一段旋律,如果這段旋律每隔 4 拍就重複一次,我們會說它有很強的相關性。自相關就是在衡量一個訊號 $x(t)$ 與它自己延遲(Lag)一段時間 $\tau$ 後的相似程度。
對於廣義平穩過程(WSS,wide-sense stationary),自相關僅取決於時間差 $\tau$,而與絕對時間 $t$ 無關。
A. 集合平均定義 (ensemble average) — 理論視角
對於廣義平穩過程(WSS,wide-sense stationary),集體平均的自相關函數定義為:
這反映了所有樣本路徑的隨機變數 $x$ 在任何時間點 $ t $ 與 $ t-\tau $ (相隔 $\tau$ 距離)之間的統計關聯性。
B. 時間平均定義 (time average) — 實務視角
當平穩過程具備遍歷性 (ergodicity) 時,我們可以用(任一樣本路徑下)一段足夠長的觀測數據來計算:
也就是說:將訊號平移 $\tau$,然後與原訊號相乘並累加。如果數值愈高,代表重合度越高,訊號的自我重複性越強。
二. 能量的縮放:自共變異數 (auto-covariance)
自相關函數雖然好用,但它包含了訊號的「平均值」。在統計學中,我們通常更關心「波動」本身的關聯。
當我們把訊號扣除平均值 $\mu$($ = \langle x \rangle$)後再做自相關,得到的就叫自共變異數 ($\gamma_{xx}$):
這就像是把自相關函數「平移」到以零為中心,專注於描述資料如何同步震盪。數學上,自共變異數與自相關函數有以下關係[註1]:
三. 變異數 (variance) 是自相關的特例
現在,請思考一個有趣的情況:如果延遲時間 $\tau = 0$ 會發生什麼?
當 $\tau = 0$ 時,代表訊號完全沒有平移,是自己在跟自己比對。這時候:
自共變異數變成了 $\gamma_0 = \langle |x(t) - \mu|^2 \rangle$ —— 這正是變異數 (variance) 的定義!
變異數代表了這個序列在「零延遲」時所擁有的能量。
四. 總結:三者的邏輯鏈條
這三者的關係可以用一句話串聯:
💥💥💥💥💥
[註1]:
我們可從廣義平穩過程 (Wide-Sense Stationary, WSS) 的定義出發來進行證明。
1. 定義回顧
首先,我們列出參與證明的核心成員:
自相關函數 (autocorrelation): $R_{xx}(\tau) = \langle x(t)x^*(t-\tau) \rangle$
自共變異數函數 (autocovariance): $\gamma_{xx}(\tau) = \langle (x(t) - \mu) \cdot (x(t-\tau) - \mu)^* \rangle$
平均值 (mean): $\langle X(t) \rangle = \langle X(t-\tau) \rangle = \mu$ (在平穩假設下為常數)
2. 證明步驟
我們從自共變異數的定義式展開:
Step 1: 展開括號內的乘積
利用分配律展開:
Step 2: 利用期望值的線性性質 (linearity of expectation)
期望值具有 $\langle A+B \rangle = \langle A \rangle + \langle B \rangle$ 的特性,且常數可以提到期望值之外:
Step 3: 代入定義項
根據定義:
$\langle x(t)x^*(t-\tau) \rangle $ 就是 $R_{xx}(\tau)$
$\langle x(t) \rangle $ 是 $\mu$
$\langle x^*(t-\tau) \rangle $ 是 $\mu^*$
$\langle |\mu_x|^2 \rangle $ 是一個常數的期望值,等於其自身 $|\mu_x|^2$
代入後得到:
留言
張貼留言