自相關函數(auto-correlation function)、自共變異數(auto-covariance)與變異數(variance)
在數據分析的世界裡,我們經常問一個問題:「現在發生的事,跟過去有關聯嗎?」要回答這個問題,最強大的工具就是 自相關函數 (autocorrelation function) 。 一. 什麼是自相關?(從「相似度」出發) 想像你在聽一段旋律,如果這段旋律每隔 4 拍就重複一次,我們會說它有很強的相關性。自相關就是在衡量一個訊號 $x(t)$ 與它自己延遲(Lag)一段時間 $\tau$ 後的 相似程度 。 對於廣義平穩過程(WSS,wide-sense stationary),自相關僅取決於 時間差 $\tau$ ,而與絕對時間 $t$ 無關。 A. 集合平均定義 (ensemble average) — 理論視角 對於廣義平穩過程(WSS,wide-sense stationary),集體平均的自相關函數定義為: $$R_{xx}(\tau) = \langle x(t) x^*(t-\tau) \rangle$$ 這反映了所有樣本路徑的隨機變數 $x$ 在任何時間點 $ t $ 與 $ t-\tau $ (相隔 $\tau$ 距離)之間的統計關聯性。 B. 時間平均定義 (time average) — 實務視角 當平穩過程具備遍歷性 (ergodicity) 時,我們可以用(任一樣本路徑下)一段足夠長的觀測數據來計算: $$r_{xx}(\tau) = \lim_{T \to \infty} \frac{1}{T} \int_{-T/2}^{T/2} x(t) x^*(t-\tau) \, dt$$ 也就是說:將訊號平移 $\tau$,然後與原訊號相乘並累加。如果數值愈高,代表重合度越高,訊號的自我重複性越強。 二. 能量的縮放:自共變異數 (auto-covariance) 自相關函數雖然好用,但它包含了訊號的「平均值」。在統計學中,我們通常更關心「波動」本身的關聯。 當我們把訊號扣除平均值 $\mu$($ = \langle x \rangle$)後再做自相關,得到的就叫自共變異數 ($\gamma_{xx}$): $$\gamma_{xx}(\tau) = \left\langle (x(t) - \mu) \cdot (x(t-\tau) - \mu)^* \right\rangle$$ 這就像是把自相關函數「平移」到以零為中心,專注於描...