Материал из Википедии — свободной энциклопедии
Выборочная дисперсия в математической статистике — это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки. Виды выборочных дисперсий:
смещённая; несмещённая, или исправленная
ОпределенияПусть X 1 , … , X n , … {\displaystyle X_{1},\ldots ,X_{n},\ldots } — выборка из распределения вероятности . Тогда
S n 2 = 1 n ∑ i = 1 n ( X i − X ¯ ) 2 = 1 n ∑ i = 1 n X i 2 − ( 1 n ∑ i = 1 n X i ) 2 {\displaystyle S_{n}^{2}={\frac {1}{n}}\sum \limits _{i=1}^{n}\left(X_{i}-{\bar {X}}\right)^{2}={\frac {1}{n}}\sum \limits _{i=1}^{n}X_{i}^{2}-\left({\frac {1}{n}}\sum \limits _{i=1}^{n}X_{i}\right)^{2}} ,где символ X ¯ {\displaystyle {\bar {X}}} обозначает выборочное среднее ;
несмещённая (исправленная) дисперсия — это случайная величина S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ¯ ) 2 {\displaystyle S^{2}={\frac {1}{n-1}}\sum \limits _{i=1}^{n}\left(X_{i}-{\bar {X}}\right)^{2}} .
ЗамечаниеОчевидно,
S 2 = n n − 1 S n 2 {\displaystyle S^{2}={\frac {n}{n-1}}S_{n}^{2}} .
Свойства выборочных дисперсийОбе выборочные дисперсии являются состоятельными оценками теоретической дисперсии. Если D [ X i ] = σ 2 < ∞ {\displaystyle \mathrm {D} [X_{i}]=\sigma ^{2}<\infty } , то S n 2 → P σ 2 {\displaystyle S_{n}^{2}\to ^{\!\!\!\!\!\!\mathbb {P} }\;\sigma ^{2}} и
S 2 → P σ 2 {\displaystyle S^{2}\to ^{\!\!\!\!\!\!\mathbb {P} }\;\sigma ^{2}} ,где символ «→ P {\displaystyle \to ^{\!\!\!\!\!\!\mathbb {P} }} » обозначает сходимость по вероятности .
Выборочная дисперсия является смещённой оценкой теоретической дисперсии, а исправленная выборочная дисперсия — несмещённой: E [ S n 2 ] = n − 1 n σ 2 {\displaystyle \mathbb {E} \left[S_{n}^{2}\right]={\frac {n-1}{n}}\sigma ^{2}} ,и
E [ S 2 ] = σ 2 {\displaystyle \mathbb {E} \left[S^{2}\right]=\sigma ^{2}} .В самом деле E [ S n 2 ] = E [ 1 n ∑ i = 1 n ( Y i − 1 n ∑ j = 1 n Y j ) 2 ] = 1 n ∑ i = 1 n E [ Y i 2 − 2 n Y i ∑ j = 1 n Y j + 1 n 2 ∑ j = 1 n Y j ∑ k = 1 n Y k ] = 1 n ∑ i = 1 n ( E [ Y i 2 ] − 2 n ( ∑ j ≠ i E [ Y i Y j ] + E [ Y i 2 ] ) + 1 n 2 ∑ j = 1 n ∑ k ≠ j n E [ Y j Y k ] + 1 n 2 ∑ j = 1 n E [ Y j 2 ] ) = 1 n ∑ i = 1 n ( n − 2 n E [ Y i 2 ] − 2 n ∑ j ≠ i E [ Y i Y j ] + 1 n 2 ∑ j = 1 n ∑ k ≠ j n E [ Y j Y k ] + 1 n 2 ∑ j = 1 n E [ Y j 2 ] ) = 1 n ∑ i = 1 n [ n − 2 n ( σ 2 + μ 2 ) − 2 n ( n − 1 ) μ 2 + 1 n 2 n ( n − 1 ) μ 2 + 1 n ( σ 2 + μ 2 ) ] = n − 1 n σ 2 {\displaystyle {\begin{aligned}\operatorname {E} [S_{n}^{2}]&=\operatorname {E} \left[{\frac {1}{n}}\sum _{i=1}^{n}{\left(Y_{i}-{\frac {1}{n}}\sum _{j=1}^{n}Y_{j}\right)}^{2}\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} \left[Y_{i}^{2}-{\frac {2}{n}}Y_{i}\sum _{j=1}^{n}Y_{j}+{\frac {1}{n^{2}}}\sum _{j=1}^{n}Y_{j}\sum _{k=1}^{n}Y_{k}\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left(\operatorname {E} \left[Y_{i}^{2}\right]-{\frac {2}{n}}\left(\sum _{j\neq i}\operatorname {E} \left[Y_{i}Y_{j}\right]+\operatorname {E} \left[Y_{i}^{2}\right]\right)+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k\neq j}^{n}\operatorname {E} \left[Y_{j}Y_{k}\right]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\operatorname {E} \left[Y_{j}^{2}\right]\right)\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left({\frac {n-2}{n}}\operatorname {E} \left[Y_{i}^{2}\right]-{\frac {2}{n}}\sum _{j\neq i}\operatorname {E} \left[Y_{i}Y_{j}\right]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k\neq j}^{n}\operatorname {E} \left[Y_{j}Y_{k}\right]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\operatorname {E} \left[Y_{j}^{2}\right]\right)\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left[{\frac {n-2}{n}}\left(\sigma ^{2}+\mu ^{2}\right)-{\frac {2}{n}}(n-1)\mu ^{2}+{\frac {1}{n^{2}}}n(n-1)\mu ^{2}+{\frac {1}{n}}\left(\sigma ^{2}+\mu ^{2}\right)\right]\\[5pt]&={\frac {n-1}{n}}\sigma ^{2}\end{aligned}}}
( n − 1 ) S 2 σ 2 ∼ χ n − 1 2 {\displaystyle (n-1){\frac {S^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}} ,D [ S 2 ] = D ( σ 2 n − 1 χ n − 1 2 ) = σ 4 ( n − 1 ) 2 D ( χ n − 1 2 ) = 2 σ 4 n − 1 . {\displaystyle \operatorname {D} \left[S^{2}\right]=\operatorname {D} \left({\frac {\sigma ^{2}}{n-1}}\chi _{n-1}^{2}\right)={\frac {\sigma ^{4}}{{\left(n-1\right)}^{2}}}\operatorname {D} \left(\chi _{n-1}^{2}\right)={\frac {2\sigma ^{4}}{n-1}}.}
См. также