チェビシェフの不等式

  総数 $n$ のデータ $\{x_{1}, x_{2},\cdots,x_{n}\}$ の平均と標準偏差をそれぞれ $\overline{x}$, $s$ とする。 このとき、

データに対するチェビシェフの不等式00

を満たすデータの数は、

データに対するチェビシェフの不等式01

より少ない。ここで $\lambda$ は $\lambda>1$ を満たす任意の数とする。 これをチェビシェフの不等式 (Chebyshev inequality) と呼ぶ
最終更新 2015 年 9 月 12 日


  証明

  標準偏差の定義より、$s^2$ は、

データに対するチェビシェフの不等式02

である。
  右辺を $|x_{i} - \overline{x}| > \lambda s$ を満たす項と、 $|x_{i} - \overline{x}| \leq \lambda s$ を満たす項に分けて、

データに対するチェビシェフの不等式03

と表す。
  右辺の第一項の総和では、全ての項で $|x_{i} - \overline{x}| > \lambda s$ が満たされるので、 $(x_{i} - \overline{x})^2 > \lambda^2 s^2 $ も満たされる。 ゆえに

データに対するチェビシェフの不等式04

が成立する。 これより、

データに対するチェビシェフの不等式05

が成立する。
  この式と、右辺の第二項の総和が正であることから、

データに対するチェビシェフの不等式06

が成立する。
  $\lambda^2 s^2$ は正の定数であるので、この数で両辺を割ると、

データに対するチェビシェフの不等式07

を得る。
  右辺の総和 $\sum_{|x_{i} - \overline{x}| > \lambda s} 1$ は、 $|x_{i} - \overline{x}| > \lambda s$ を満たすデータの総数を表すので、 次の結論を得る。すなわち、

データに対するチェビシェフの不等式08


  補足

  $\lambda = 3$ の場合、チェビシェフの不等式は、

「 $ |x_{i}-\overline{x} | > 3 s $ を満たすデータの総数は、$\frac{n}{9}$ より少ない。」


と言い表される。
  これは、平均値 $\overline{x}$ から標準偏差の 3 倍よりも離れたデータの総数が、 全体の $1/9$ よりも少ないことを意味する。







ページのトップへ戻る