自相關函數(auto-correlation function)、自共變異數(auto-covariance)與變異數(variance)

在數據分析的世界裡,我們經常問一個問題:「現在發生的事,跟過去有關聯嗎?」要回答這個問題,最強大的工具就是自相關函數 (autocorrelation function)

一. 什麼是自相關?(從「相似度」出發)

想像你在聽一段旋律,如果這段旋律每隔 4 拍就重複一次,我們會說它有很強的相關性。自相關就是在衡量一個訊號 $x(t)$ 與它自己延遲(Lag)一段時間 $\tau$ 後的相似程度

對於廣義平穩過程(WSS,wide-sense stationary),自相關僅取決於時間差 $\tau$,而與絕對時間 $t$ 無關。

A. 集合平均定義 (ensemble average) — 理論視角

對於廣義平穩過程(WSS,wide-sense stationary),集體平均的自相關函數定義為:

$$R_{xx}(\tau) = \langle x(t) x^*(t-\tau) \rangle$$

這反映了所有樣本路徑的隨機變數 $x$ 在任何時間點 $ t $ 與 $ t-\tau $ (相隔 $\tau$ 距離)之間的統計關聯性。

B. 時間平均定義 (time average) — 實務視角

當平穩過程具備遍歷性 (ergodicity) 時,我們可以用(任一樣本路徑下)一段足夠長的觀測數據來計算:

$$r_{xx}(\tau) = \lim_{T \to \infty} \frac{1}{T} \int_{-T/2}^{T/2} x(t) x^*(t-\tau) \, dt$$

也就是說:將訊號平移 $\tau$,然後與原訊號相乘並累加。如果數值愈高,代表重合度越高,訊號的自我重複性越強。

二. 能量的縮放:自共變異數 (auto-covariance)

自相關函數雖然好用,但它包含了訊號的「平均值」。在統計學中,我們通常更關心「波動」本身的關聯。

當我們把訊號扣除平均值 $\mu$($ = \langle x \rangle$)後再做自相關,得到的就叫自共變異數 ($\gamma_{xx}$):

$$\gamma_{xx}(\tau) =  \left\langle (x(t) - \mu) \cdot (x(t-\tau) - \mu)^* \right\rangle$$

這就像是把自相關函數「平移」到以零為中心,專注於描述資料如何同步震盪。數學上,自共變異數與自相關函數有以下關係[註1]:

$$\gamma_{xx}(\tau) = R_{xx}(\tau) - |\mu|^2$$

三. 變異數 (variance) 是自相關的特例

現在,請思考一個有趣的情況:如果延遲時間 $\tau = 0$ 會發生什麼?

$\tau = 0$ 時,代表訊號完全沒有平移,是自己在跟自己比對。這時候:

  1. 自共變異數變成了 $\gamma_0 = \langle |x(t) - \mu|^2 \rangle$ —— 這正是變異數 (variance) 的定義!

  2. 變異數代表了這個序列在「零延遲」時所擁有的能量。

四. 總結:三者的邏輯鏈條

這三者的關係可以用一句話串聯:

自相關衡量相似性,扣除均值貢獻後成為自共變異數,而當時間差為零時,它所展現的總強度就是變異數


💥💥💥💥💥

[註1]:

我們可從廣義平穩過程 (Wide-Sense Stationary, WSS) 的定義出發來進行證明。

1. 定義回顧

首先,我們列出參與證明的核心成員:

  • 自相關函數 (autocorrelation): $R_{xx}(\tau) = \langle x(t)x^*(t-\tau) \rangle$

  • 自共變異數函數 (autocovariance): $\gamma_{xx}(\tau) = \langle (x(t) - \mu) \cdot (x(t-\tau) - \mu)^* \rangle$

  • 平均值 (mean): $\langle X(t) \rangle = \langle X(t-\tau) \rangle = \mu$ (在平穩假設下為常數)

2. 證明步驟

我們從自共變異數的定義式展開:

Step 1: 展開括號內的乘積

$$\gamma_{xx}(\tau) = \left\langle (x(t) - \mu) \cdot (x^*(t-\tau) - \mu_x^*) \right\rangle]$$

利用分配律展開:

$$\gamma_{xx}(\tau) = \left\langle x(t)x^*(t-\tau) - x(t)\mu^* - \mu x^*(t-\tau) + \mu \mu^* \right\rangle$$

Step 2: 利用期望值的線性性質 (linearity of expectation)

期望值具有 $\langle A+B \rangle = \langle A \rangle + \langle B \rangle$ 的特性,且常數可以提到期望值之外:

$$\gamma_{xx}(\tau) = \langle x(t)x^*(t-\tau) \rangle - \langle x(t)\rangle \mu^* - \mu \langle x^*(t-\tau) \rangle + \langle |\mu_x|^2 \rangle$$

Step 3: 代入定義項

根據定義:

  • $\langle x(t)x^*(t-\tau) \rangle $ 就是 $R_{xx}(\tau)$

  • $\langle x(t) \rangle $$\mu$

  • $\langle x^*(t-\tau) \rangle $$\mu^*$

  • $\langle |\mu_x|^2 \rangle $ 是一個常數的期望值,等於其自身 $|\mu_x|^2$

代入後得到:

$$\gamma_{xx}(\tau) = R_{xx}(\tau) - \mu \mu^* - \mu \mu^* + |\mu|^2$$
化簡結果
$$\gamma_{xx}(\tau) = R_{xx}(\tau) - |\mu|^2 - |\mu|^2 + |\mu|^2 = R_{xx}(\tau) - |\mu|^2$$
至此得證。

留言

這個網誌中的熱門文章

二項、卜瓦松PMF與高斯PDF

變異數等於「平方的期望」減去「期望的平方」

坎貝爾定理 (Campbell's theorem)