bessel’s correction

Abstract

In this post, we will quickly go through the math behind Bessel’s correction.

Reference

Bessel’s correction

First, let’s assume we have n independent observations from a population with mean $mu$ and variance $sigma^2$ .
The definition of population variance $sigma^2$ is:

$sigma^2 = frac{sum_{i=1}^n(x_i - bar{x})^2}{n} tag{1}$

Given the observation, we can estimate $sigma^2$ with the sample variance $sigma_2^2$ from textbook:

$sigma_s^2 = frac{sum_{i=1}^n(x_i - bar{x})^2}{n-1} tag{2}$

Bessel’s correction is the usage of $n-1$ instead of $n$ in the denominator for the sample variance.
It’s unintuitive to think that $sigma_s^2$ is actually an unbiased estimation of $sigma^2$ :

$mathrm{E}(sigma_s^2) = mathrm{E} big[ frac{sum_{i=1}^n(x_i - bar{x})^2}{n-1} big] stackrel{?}{=} sigma^2 tag{3}$

Some useful identities

To prove (3), we need to prove a few more useful definitions, namely $mathrm{E}(x_i)$ , $mathrm{Var}(x_i)$ ,

$mathrm{E}(x_i^2)$ , $mathrm{E}(bar{x})$ , $mathrm{Var}(bar{x})$ and $mathrm{E}(bar{x}^2)$ .
By the population definition, we have:
$mathrm{E}(x_i) = mu tag{4}$
$mathrm{Var}(x_i) = sigma^2 tag{5}$
$% <![CDATA[ begin{align} mathrm{E}(x_i^2) &= mathrm{Var}(x_i) + mathrm{E}(x_i)^2 tag{$mathrm{Var}(X) = mathrm{E}(X^2) - mathrm{E}(X)^2$}\ &= sigma^2 + mu^2 tag{6} end{align} %]]&gt;$
For the sample mean $bar{x}$ , we have expected value:
$% <![CDATA[ begin{align} mathrm{E}(bar{x}) &= mathrm{E}(frac{x_1 + x_2 + ... x_n}{n}) \ &= frac{mathrm{E}(x_1 + x_2 + ... x_n)}{n} \ &= frac{mathrm{E}(x_1) + mathrm{E}(x_2) + ... mathrm{E}(x_n)}{n} \ &= frac{n mu}{n} \ &= mu tag{7} end{align} %]]&gt;$
Similarly, for variance of sample mean:
$% <![CDATA[ begin{align} mathrm{Var}(bar{x}) &= mathrm{Var}(frac{x_1 + x_2 + ... x_n}{n}) \ &= frac{mathrm{Var}(x_1 + x_2 + ... x_n)}{n^2} tag{$mathrm{Var}(cX)=c^2mathrm{Var}(X)$} \ &= frac{mathrm{Var}(x_1) + mathrm{Var}(x_2) + ... mathrm{Var}(x_n)}{n^2} \ &= frac{n sigma^2}{n^2} \ &= frac{sigma^2}{n} tag{8} end{align} %]]&gt;$
Given (7) and (8), we have:
$% <![CDATA[ begin{align} mathrm{E}(bar{x}^2) &= mathrm{Var}(bar{x}) + mathrm{E}(bar{x})^2 tag{$mathrm{Var}(X) = mathrm{E}(X^2) - mathrm{E}(X)^2$}\ &= frac{sigma^2}{n} + mu^2 tag{9} end{align} %]]&gt;$

Proof

Given the above identities, proving (3) is straight forward. Let’s ignore the denominator $n-1$ for now:
$% <![CDATA[ begin{align} & mathrm{E} big[ sum_{i=1}^n (x_i - bar{x})^2 big] \ &= mathrm{E} big[ sum_{i=1}^n (x_i^2 - 2 x_i bar{x} + bar{x}^2) big] \ &= mathrm{E} big[ sum_{i=1}^n x_i^2 - sum_{i=1}^n 2 x_i bar{x} + sum_{i=1}^n bar{x}^2 big] \ &= mathrm{E} big[ sum_{i=1}^n x_i^2 - 2 bar{x} sum_{i=1}^n x_i + n bar{x}^2 big] tag{$bar{x}$ is constant} \ &= mathrm{E} big[ sum_{i=1}^n x_i^2 - 2 bar{x} (n bar{x}) + n bar{x}^2 big] tag{$sum_{i=1}^n x_i = n bar{x}$} \ &= mathrm{E} big[ sum_{i=1}^n x_i^2 - 2 n bar{x}^2 + n bar{x}^2 big] \ &= mathrm{E} big[ sum_{i=1}^n x_i^2 - n bar{x}^2 big] \ &= sum_{i=1}^n mathrm{E}(x_i^2) - mathrm{E}(n bar{x}^2) \ &= sum_{i=1}^n mathrm{E}(x_i^2) - n mathrm{E}(bar{x}^2) \ &= sum_{i=1}^n sigma^2 + mu^2 - frac{sigma^2}{n} + mu^2 tag{given (6), (9)} \ &= sum_{i=1}^n sigma^2 - frac{sigma^2}{n} \ &= n sigma^2 - sigma^2 tag{$sigma^2$ is constant} \ &= (n - 1) sigma^2 tag{10} \ end{align} %]]&gt;$
Given (10), it’s not hard to see that:
$frac{mathrm{E} big[ sum_{i=1}^n (x_i - bar{x})^2 big]}{n-1} = mathrm{E} big[ frac{sum_{i=1}^n (x_i - bar{x})^2}{n-1} big] = mathrm{E} (sigma_s^2) = sigma^2 tag{11}$

bessel’s correction

Abstract

Reference

Bessel’s correction

Some useful identities

Proof

近期文章

近期评论

标签

热门

文章归档

分类目录

功能