弱収束

確率要素の列 ${Xn}_n$ が確率変数 $X$ へと弱収束するとは 任意の有界連続関数 $h$ に対して \[ \lim_{n\rightarrow \infty}\mathbb{E}_{X_n}[h(X_n)] = \mathbb{E}_X[h(X)] \] が成り立つことである. ここで, $\mathbb{E}_X[h(X)]$ は $h$ の $X$ に対する期待値を表す.

レヴィの連続性定理

実数値確率変数 $X_n$ ($n = 1,2,\ldots$) の特性関数を $\varphi_n(t)$ とし, 実数値確率変数 $X$ の特性関数を $\varphi(t)$ とする. このとき, 以下は同値となる. $X_n$ は $X$ に分布収束する. $\varphi_n$ は $\varphi$ に各点収束する. 証明 $X_n$ が $X$ に分布収束するならば$\varphi_n$ は $\varphi$ に各点収束すること $X_n$ が $X$ に分布収束すると仮定する. このとき任意の有界連続関数 $f$ について \[ \mathbb{E}[f(X_n)] \rightarrow \mathbb{E}[f(X)] \] が成り立つから, 特に任意の $t\in \mathbb{R}$ に対して $f_t(x) = e^{\sqrt{-1}tx}$ とおけば \[ \varphi_n(t) \rightarrow \varphi(t) \] が成り立つ. $\varphi_n$ が $\varphi$ に各点収束するならば$X_n$ は $X$ に分布収束すること

カイ二乗分布

$X_1, X_2,\cdots, X_n \sim N(0,1),\quad i.i.d.$ とする. このとき, \[ Y = X_1^2 + X_2^2 +\cdots +X_n^2 \] の分布を自由度 $n$ のカイ二乗分布とよび, $\chi^2(n)$ とかく. ガンマ分布との関係 \[ \chi^2(n)= \textrm{Ga}(n/2,2) \] である. 証明 まずは \[ \mathbb{E}[e^{\sqrt{-1}tX_1^2}] = (1-2\sqrt{-1}t)^{-1/2} \] を示そう. $s<1/2$ に対して, \[ \begin{aligned} G(s) &=\mathbb{E}[e^{sX_1^2}]\\ &= \dfrac{1}{\sqrt{2\pi}} \int e^{sx^2}e^{-x^2/2} \,dx\\ &= (1-2s)^{-1/2} \end{aligned} \] である. これより, $G(z)$ は原点近傍で正則である. 一方で複素関数 \[ (1-2z)^{-1/2} \] は $z\neq 1/2$ において正則であり, $G(z)$ と原点近傍の実軸上で一致している. よって一致の定理により $G(z)= (1-2z)^{-1/2}$ である.

標本分布論

ある確率分布 $X \sim F$ に従う互いに独立な $n$ 個の確率変数 $X_1,X_2,\cdots X_n$ を得るとする. すなわち, 同時分布 $F_N$ について \[ F_N(x_1, x_2, \cdots, x_n) = F(x_1)F(x_2)\cdots F(x_n) \] であるとする. このことを単にこれから \[ X_1,X_2,\cdots , X_n \sim F\quad i.i.d. \] と表す. また, $\mathbb{E}[X]$ を母集団分布の平均, または母平均と呼び, と標本平均 $\overline{X}$ を \[ \overline{X} = \dfrac{1}{n}\sum_{i=1}^n X_n \] により定める($\overline{X}$ は確率変数の和なので確率変数である). さらに, 関数 $T:x=(x_1,x_2,\cdots x_n) \mapsto T(x)\in \mathbb{R}^k$ としたとき, 確率変数 $T(X)$ を $k$-次元統計量と呼ぶ. $k=1$ のとき, たんに統計量と呼ぶ. また, 標本平均は統計量である. 統計量の従う分布を標本分布と呼ぶ.

特性関数

特性関数の定義 確率変数 $X$ に対して, 特性関数 $\phi_X: \mathbb{R}\rightarrow \mathbb{R}$ を \[ \phi_X(t) = \mathbb{E}[e^{\sqrt{-1}Xt}], \quad t\in \mathbb{R} \] により定める. 特性関数は連続関数 任意の $t, h$ について, \[ \left|\phi_X(t+h) - \phi_X(t)\right| \le \mathbb{E}\left[\left|e^{\sqrt{-1}hX}-1\right|\right] \] であり, 任意の $x$ に対して $|e^{\sqrt{-1}tx} -1| \rightarrow 0$ であることから, 優収束定理により右辺は $0$ に収束する. 特性関数の性質1. 反転公式 確率変数 $X$ の分布 $F_X$ から特性関数 $\phi_X$ を構成したのに対して, 関数 $\phi_X$ から分布 $F_X$ を対応付けることができる. これを反転公式という. 離散分布の場合 実現値が整数のみとなる離散分布の場合, 次のような反転公式が成り立つ. 任意の $k \in \mathbb{Z}$ について, \[ p_X(k) = \dfrac{1}{2\pi}\int_{-\pi}^\pi e^{-\sqrt{-1}kt}\phi_X(t)\,dt. \]

積分と期待値・分散

積分 確率変数 $X$ に対して, $F_X$ はその分布とし, 連続分布か離散分布のいずれかであるとする. 関数 $g$ を実数値の関数であるとする. このとき, $F_X$ による積分を \[ \int_A g(x)\,dF_X(x) =\begin{cases} \displaystyle\int_A g(x)f_X(x)\,dx,\quad \text{$F$ が連続分布のとき}, \\ \displaystyle\sum_{x\in A}g(x)p_X(x),\quad \text{$F$ が離散分布のとき} \end{cases} \] により定める(確率変数 $X$ による積分とも呼ぶ). ここで, 関数 $f_X$, $p_X$ はそれぞれ $X$ の確率密度関数, 確率質量関数を表す. ただし, この定義は $g(x)$ が $F_X(x)\,dx$ について絶対可積分であるときに意味を持つ. 期待値 確率変数 $X$ とその分布 $F_X$ について, 積分 \[ \int_\mathbb{R} |x| \,dF_X(x) \] が有限であるとする. このとき, $X$ の期待値を \[ \mathbb{E}_X[X] = \int_\mathbb{R} x\,dF_X(x) \] により定める. さらに確率変数 $Y$ とその分布 $F_Y$ についても積分

連続分布と離散分布

連続分布 確率変数 $X$ が連続分布を持つとは, 分布関数 $F_X$ が微分可能であることを言う. さらにこのとき, $X$ の確率密度関数 $f_X$ を \[ f_X(x) = \dfrac{d F_X(x)}{d x}, \quad x\in \mathbb{R} \] により定める. 定義より明らかに \[ F_X(x) = P(X\le x) = \int_{-\infty}^x f(y)\,dy, \quad x \in \mathbb{R} \] が成り立つ. 離散分布 確率変数 $X$ が離散分布を持つとは, 高々加算無限な集合 $M\subset \mathbb{R}$で, \[ P(X\in M) = 1 \] となるときを言う. このとき, \[ p_X(x) = P(X=x) ,\quad x \in M \] を確率質量関数と呼ぶ. 連続分布でも離散分布でもない場合 あるけど扱わない

統計で扱う確率の記法

確率の記法をまとめる 確率とは 事象 $A$ に対して $P:A \mapsto [0,1]$ を対応させる写像みたいなもの. 和の法則とかを満たす 確率変数とは 実数に値をとる関数 $X$ が確率変数であるとは, \[ F_X(x) = P(X\le x), \quad x\in \mathbb{R} \] が [0,1] に値をとる単調増加関数であり, \[ \begin{aligned} \lim_{x\rightarrow -\infty} F_X(x) &= 0,\\ \lim_{x\rightarrow +\infty} F_X(x) &= 1,\\ \end{aligned} \] をみたすものを言う. また, ここで現れた単調増加関数 $F_X: \mathbb{R} \rightarrow [0,1]$ を累積分布関数, または, 分布関数と呼ぶ. 一方で, 確率変数 $X$ と関数 $F$ の間に \[ F(x) = P(X\le x), \quad x\in \mathbb{R} \] が成り立つとき, $X$ は分布 $F$ に従うといい, $X\sim F$ と書く.

記述統計の用語

1次元、1変量の場合 $n\in \mathbb{N}$: 標本の大きさ $x_1,x_2,\cdots x_n \in \mathbb{R}$: 観測値に対して, \[ \overline{x} = \dfrac{1}{n}\sum_{i=1}^n x_i \] を標本平均と呼び, \[ s^2 = \dfrac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2 \] を標本分散と呼ぶ. 2変量の場合 $n\in \mathbb{N}$: 標本の大きさ $(x_1, y_1),(x_2,y_2),\cdots (x_n,y_n) \in \mathbb{R}\times \mathbb{R}$: 観測値に対して, \[ \begin{aligned} \overline{x} &= \dfrac{1}{n}\sum_{i=1}^n x_i,\\ \overline{y} &= \dfrac{1}{n}\sum_{i=1}^n y_i \end{aligned} \] を標本平均と呼び, \[ s_{xy} = \dfrac{1}{n}\sum_{i=1}^n (x_i-\overline{x})(y_i - \overline{y}) \] を観測値 $x, y$ 間の共分散と呼ぶ. \[ r_{xy} = \dfrac{s_{xy}}{\sqrt{s_{xx}s_{yy}}} \] を標本相関係数と呼ぶ. 多変量の場合 $n\in \mathbb{N}$: 標本の大きさ $p\in \mathbb{N}$: 変数の数