不少人談天氣預報,最常問的是一句話:準不準。若標準只是不要漏報,那麼答案其實很簡單。每天都預報下雨,命中所有雨天,命中率自然是100%。這樣的預報看似高明,實則空洞。
在預報驗證中,最基本的指標之一是POD,即Probability of Detection,探測率。它的計算方法是命中的次數除以實際發生的次數。假設一年有100天下雨,只要那100天全部預報到,POD就是100%。若每天都預報下雨,這個條件必然成立。於是,一個毫無判斷力的人,也可以在紙面上取得滿分。
問題隨即出現。其餘265天其實沒有下雨,卻全部被預報為雨天。這些錯誤稱為誤報。這時便要看FAR,即False Alarm Ratio,誤報率。它的計算方法是誤報次數除以所有預報為事件的次數。在每天都報雨的情況下,365次預報中只有100次正確,265次誤報,FAR約為73%。換言之,超過七成時間在虛驚。這樣的預報,難以贏得信任。
因此,只看POD沒有意義。預報可以透過極端策略拉高命中率,卻同時放大誤報。相反,若從不預報下雨,誤報率是零,但所有雨天全部漏掉,POD為零。這同樣沒有價值。真正的挑戰,在於兩者之間找到合理位置。
氣象學上常用CSI,即Critical Success Index,臨界成功指數,來同時衡量命中、誤報與漏報。它以命中次數除以命中、誤報與漏報三者之和。若預報過於激進或過於保守,CSI都會偏低。只有在適度平衡之下,CSI才會上升。這個指標要求預報員對整體表現負責,而非沉迷單一數字。
這背後其實是風險管理。若漏報代價極高,例如強降雨可能引發山泥傾瀉,那麼可以容忍較高誤報。若誤報代價高昂,例如錯誤停課或停工帶來經濟損失,則必須壓低誤報率。預報從來不是猜中與否的比賽,而是成本與風險的權衡。
以上只是最基本的分類預報驗證方法。現代天氣預報大量採用機率形式,例如預報降雨概率為30%或70%。這類機率預報的驗證涉及可靠度、解析度、Brier Score等更深入概念,遠比POD與CSI複雜。如何檢驗一個機率預報是否既可靠又有區分能力,是另一層次的問題。本文暫不展開,日後可再細談。
所謂百分之百準確,往往只是定義上的遊戲。只要選擇對自己有利的指標,就可以製造漂亮成績。真正負責任的預報,必須同時接受多項指標檢驗,並清楚說明取捨邏輯。數字不會說話,但人會選擇說哪一種數字。
天氣預報如此,其他預測亦然。若只追求表面準確,而不面對代價與不確定性,任何預測都可以看起來完美。問題不在於能否做到全對,而在於我們是否願意誠實地衡量其意義。

