什麼是均方誤差 Mean-Square Error, MSE?

什麼是Mean-Square Error? 關於均方誤差的解釋
關於均方誤差 Mean-Square Error, MSE

MSE(Mean-Square Error),中文稱為均方誤差

  • 是各測量值誤差的平方和取平均值的平方根(均方根誤差的平方)
  • 可以評價數據的變化程度
  • 數學特性很好,使計算梯度變得更容易

顧名思義,均方誤差(MSE)度量的是預測值和實際觀測值間差的平方的均值。它只考慮誤差的平均大小,不考慮其方向。但由於經過平方,與真實值偏離較多的預測值會比偏離較少的預測值受到更為嚴重的懲罰。再加上 MSE 的數學特性很好,這使得計算梯度變得更容易。

又被稱為 L2 損失 或 L2範數損失/平方損失

L2 Loss Function


均方誤差的基本解釋

MSE 是網路的性能函式,網路的均方誤差稱作「Mean Square Error」。比如有 n 對輸入輸出資料,每對為 [Pi,Ti],i = 1,2, … ,n,網路通過訓練後有網路輸出,記為 Yi。

在相同測量條件下進行的測量稱為等精度測量,例如在同樣的條件下,用同一個遊標卡尺測量銅棒的直徑若干次,這就是等精度測量。對於等精度測量來說,還有一種更好的表示誤差的方法,就是標準誤差

標準誤差定義為各測量值誤差的平方和的平均值的平方根,故又稱為均方誤差。數理統計中均方誤差是指參數估計值與參數真值之差平方的期望值,記為 MSE。MSE 是衡量「平均誤差」的一種較方便的方法,MSE 可以評價資料的變化程度,MSE 的值越小,說明預測模型描述實驗資料具有更好的精確度。與此相對應的,還有均方根誤差RMSE、平均絕對百分誤差等等。

均方誤差(Mean-Square Error, MSE)在維基百科上的解釋:

是對於無法觀察的參數的一個估計函數T;其定義為:

\operatorname {MSE}(T)=\operatorname {E}((T-\theta )^{2}),

即,它是「誤差」的平方的期望值。誤差就是估計值與被估計量的差。均方誤差滿足等式:

\operatorname {MSE}(T)=\operatorname {var}(T)+(\operatorname {bias}(T))^{2}

其中

\operatorname {bias}(T)=\operatorname {E}(T)-\theta ,

也就是說,偏差是估計函數的期望值與那個無法觀察的參數的差。


均方誤差(MSE)對於損失函數的意義

均方誤差 (MSE) 是最常用的回歸損失函數,計算方法是求預測值與真實值之間距離的平方和,公式如下:

均方誤差 Mean-Square Error, MSE 公式
均方誤差 Mean-Square Error, MSE 公式

下圖是 MSE 函數的圖像,其中目標值是 100,預測值的範圍從 -10000 到 10000,Y 軸代表的 MSE 取值範圍是從 0 到正無窮,並且在預測值為 100 處達到最小。

MSE 函數的圖像
MSE 函數的圖像