一. 隨機誤差的正態分布
1. 正態分布
隨機誤差的規律服從正態分布規律,可用正態分布曲線(高斯分布的正態概率密度函數)表示:
(13)
式中:y —概率密度; m—總體平均值;s —總體標準偏差。
正態分布曲線依賴于m 和s 兩個基本參數,曲線隨m 和s 的不同而不同。為簡便起見,使用一個新變數(u)來表達誤差分布函數式:
(14)
u的涵義是:偏差值(x-m)以標準偏差為單位來表示。
變換后的函數式為:
(15)
由此繪制的曲線稱為“標準正態分布曲線” 。因為標準正態分布曲線橫坐標是以s 為單位,所以對于不同的測定值 m 及s ,都是適用的。
圖1:兩組精密度不同的測定值 圖2:標準正態分布曲線
的正態分布曲線
“標準正態分布曲線”清楚地反映了隨機誤差的分布性質:
(1)集中趨勢 當 x=m 時(u=0),,y此時最大,說明測定值x集中在 m 附近,或者說,m 是最可信賴值。
(2)對稱趨勢 曲線以 x=m 這一直線為對稱軸,表明:
正負誤差出現的概率相等。大誤差出現的概率小,小誤差出現的概率大;很大誤差出現的概率極小。在無限多次測定時,誤差的算術平均值極限為 0 。
(3)總概率 曲線與橫坐標從-µ 到 + µ 在之間所包圍的面積代表具有各種大小誤差的測定值出現的概率的總和,其值為1(100%)
(16)
用數理統計方法可以證明并求出測定值 x 出現在不同 u 區間的概率(不同 u 值時所占的面積)即 x 落在 m± us 區間的概率:
置信區間 置信概率
u = ± 1.00 x = m ± 1.00 s 68.3%
u = ± 1.96 x = m ± 1.96 s 95.0%
u = ± 3.00 x = m ± 3.00 s 99.7%
二. 有限數據隨機誤差的 t 分布
在實際測定中,測定次數是有限的,只有和S,此時則用能合理地處理少量實驗數據的方法—t 分布
1. t 分布曲線 (實際測定中,用 、S 代替m、s)
t 分布曲線與標準正態分布曲線相似,縱坐標仍為概率密度,縱坐標則是新的統計量t
(17)
無限次測定,u一定 ® P 就一定;
有限次測定:t 一定 ® P 隨 n (自由度)不同而不同。
不同的 n 值及概率所對應的t值,已有統計學家計算出來,可由有關表中查出。
2. 平均值的置信區間
應用t分布估計真值范圍,考慮的符號時,則可得到如下關系式:
m = x ± tP,n S (18)
同樣,對于樣本平均值也存在類似的關系式:
(19)
此式表示的是在一定概率下,以樣本平均值為中心的包括真值在內的取值范圍,即平均值的置信區間。 稱為置信區間界限。
此式表明:平均值與真值的關系,即說明平均值的可靠性。
平均值的置信區間取決于測定的精密度、測定次數和置信水平(概率)。(分析工作中常規定為 95%)
測定精密度越高(S小),測定次數越多(n大),置信區間則越小,即平均值越準確。