🎲 確率・統計 完全ガイド

大学1〜2年向けの確率・統計の決定版。基本概念→確率分布→推定検定までを図解&練習問題100問で網羅。

[AdSense 728×90]

📑 目次

1. 確率の基礎2. 条件付き確率・ベイズ3. 確率変数4. 離散確率分布5. 連続確率分布6. 多変数確率変数7. 大数の法則・中心極限定理8. 推定9. 検定📝 練習問題100問

1. 確率の基礎

確率の公理(コルモゴロフ) 標本空間$\Omega$, 事象族$\mathcal F$, 確率$P:\mathcal F\to[0,1]$ が
  1. $P(A)\ge 0$
  2. $P(\Omega)=1$
  3. 互いに素な$A_1,A_2,\ldots$ に対し $P(\bigcup A_i)=\sum P(A_i)$

基本公式

名称
余事象$P(A^c)=1-P(A)$
包除原理$P(A\cup B)=P(A)+P(B)-P(A\cap B)$
3事象の包除$P(A\cup B\cup C)=\sum P(A)-\sum P(A\cap B)+P(A\cap B\cap C)$

2. 条件付き確率・ベイズの定理

条件付き確率 $P(A|B)=\dfrac{P(A\cap B)}{P(B)}$($P(B)>0$)
独立 $P(A\cap B)=P(A)P(B)$ ⇔ $P(A|B)=P(A)$。
ベイズの定理 $$P(A_i|B)=\frac{P(B|A_i)P(A_i)}{\sum_j P(B|A_j)P(A_j)}$$ (事前確率$P(A_i)$と尤度$P(B|A_i)$から事後確率を更新)
事前 $P(A)$ 事後 $P(A|B)$ $B$観測 病気10% 病気67%

3. 確率変数

期待値 離散:$E[X]=\sum x_i P(X=x_i)$、連続:$E[X]=\int x f(x)\,dx$
分散 $V[X]=E[(X-E[X])^2]=E[X^2]-(E[X])^2$

期待値・分散の性質

公式条件
$E[aX+b]=aE[X]+b$常に
$V[aX+b]=a^2V[X]$常に
$E[X+Y]=E[X]+E[Y]$常に(独立性不要)
$V[X+Y]=V[X]+V[Y]$$X,Y$独立のとき
$E[XY]=E[X]E[Y]$$X,Y$独立のとき

4. 主要な離散分布

分布確率関数$E[X]$$V[X]$
ベルヌーイ Be($p$)$P(X=1)=p$$p$$p(1-p)$
二項 Bin($n,p$)$\binom{n}{k}p^k(1-p)^{n-k}$$np$$np(1-p)$
ポアソン Po($\lambda$)$\dfrac{\lambda^k e^{-\lambda}}{k!}$$\lambda$$\lambda$
幾何 Geo($p$)$(1-p)^{k-1}p$$1/p$$(1-p)/p^2$
負の二項$\binom{k-1}{r-1}p^r(1-p)^{k-r}$$r/p$$r(1-p)/p^2$
超幾何$\dfrac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}}$$nK/N$(複雑)

5. 主要な連続分布

分布密度関数$E[X]$$V[X]$
一様 U($a,b$)$\dfrac{1}{b-a}$$\dfrac{a+b}{2}$$\dfrac{(b-a)^2}{12}$
指数 Ex($\lambda$)$\lambda e^{-\lambda x}$$1/\lambda$$1/\lambda^2$
正規 N($\mu,\sigma^2$)$\dfrac{1}{\sqrt{2\pi}\sigma}e^{-(x-\mu)^2/(2\sigma^2)}$$\mu$$\sigma^2$
ガンマ Ga($\alpha,\beta$)$\dfrac{\beta^\alpha x^{\alpha-1}e^{-\beta x}}{\Gamma(\alpha)}$$\alpha/\beta$$\alpha/\beta^2$
ベータ Be($\alpha,\beta$)$\dfrac{x^{\alpha-1}(1-x)^{\beta-1}}{B(\alpha,\beta)}$$\dfrac{\alpha}{\alpha+\beta}$$\dfrac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$
カイ二乗 $\chi^2(n)$$=\mathrm{Ga}(n/2,1/2)$$n$$2n$

正規分布の図

$\mu$ $\mu-\sigma$ $\mu+\sigma$ 68%は$\mu\pm\sigma$、95%は$\mu\pm 2\sigma$

6. 多変数確率変数

共分散 $\mathrm{Cov}(X,Y)=E[(X-\mu_X)(Y-\mu_Y)]=E[XY]-E[X]E[Y]$
相関係数 $\rho(X,Y)=\dfrac{\mathrm{Cov}(X,Y)}{\sigma_X\sigma_Y}\in[-1,1]$
分散の和の公式 $$V[X+Y]=V[X]+V[Y]+2\,\mathrm{Cov}(X,Y)$$

7. 大数の法則・中心極限定理

大数の弱法則 $X_1,\ldots,X_n$ iid, $E[X]=\mu,V[X]<\infty$ とすると$\bar X_n\xrightarrow{P}\mu$。
中心極限定理(CLT) $\dfrac{\bar X_n-\mu}{\sigma/\sqrt n}\xrightarrow{d}N(0,1)$
💡 CLTは「どんな分布でも、たくさん足せば正規分布に近づく」という統計学の最重要結果。

8. 推定

不偏推定量 $E[\hat\theta]=\theta$ を満たす推定量。
標本平均$\bar X$は$\mu$の不偏推定量。$s^2=\frac{1}{n-1}\sum(X_i-\bar X)^2$は$\sigma^2$の不偏推定量。
正規分布の信頼区間($\sigma$既知) $$\bar X\pm z_{\alpha/2}\frac{\sigma}{\sqrt n}\quad(z_{0.025}=1.96)$$ $\sigma$未知のときは$t$分布を用い$\bar X\pm t_{\alpha/2,n-1}\dfrac{s}{\sqrt n}$。

最尤推定(MLE)の手順

1. 尤度関数 $L(\theta)=\prod f(x_i;\theta)$ を作る
2. 対数取って $\ell(\theta)=\log L$
3. $\dfrac{\partial \ell}{\partial \theta}=0$ で$\hat\theta_{\rm MLE}$ を求める

9. 仮説検定

$H_0$(帰無仮説)vs $H_1$(対立仮説)。
有意水準$\alpha$(5%, 1%)で検定統計量が棄却域にあれば$H_0$を棄却。
真実\判定$H_0$採択$H_0$棄却
$H_0$真正解第1種誤り($\alpha$)
$H_1$真第2種誤り($\beta$)正解(検出力$1-\beta$)

主要な検定

検定統計量分布
母平均($\sigma$既知)$\dfrac{\bar X-\mu_0}{\sigma/\sqrt n}$$N(0,1)$
母平均($\sigma$未知)$\dfrac{\bar X-\mu_0}{s/\sqrt n}$$t(n-1)$
母分散$\dfrac{(n-1)s^2}{\sigma_0^2}$$\chi^2(n-1)$
2標本平均差(プール分散使用)$t$分布
適合度$\sum\dfrac{(O_i-E_i)^2}{E_i}$$\chi^2$
[AdSense レスポンシブ]

📝 練習問題100問+解答

A. 確率の基礎(問1〜15)

1 サイコロ2個の和が7になる確率。
解答$6/36=1/6$
2 トランプ52枚から1枚引いてエースまたはハートの確率。
解答$4/52+13/52-1/52=16/52=4/13$
3 コイン3回で表3回の確率。
解答$1/8$
4 5人をランダムに並べる、AとBが隣り合う確率。
解答$2\cdot4!/5!=2/5$
5 30人クラスで誕生日が一致する人がいる確率(誕生日問題)。
解答$1-\dfrac{365\cdot364\cdots336}{365^{30}}\approx 0.706$
6 3人が独立に的中率$0.7$で射撃。少なくとも1人当てる確率。
解答$1-0.3^3=0.973$
7 サイコロを6回振り、6が少なくとも1回出る確率。
解答$1-(5/6)^6\approx 0.665$
8 包除:$P(A)=P(B)=P(C)=0.5,$ペア交わり$=0.3,$3つ交わり$=0.1$。$P(A\cup B\cup C)$は?
解答$1.5-0.9+0.1=0.7$
9 1〜100からランダムに1つ。3または5の倍数となる確率。
解答$33/100+20/100-6/100=47/100$
10 モンティ・ホール問題:3つのドア、車1台。最初に1つ選び、司会者がハズレを開ける。変えるべきか?
解答変えると勝率$2/3$、変えないと$1/3$。変えるべき。
11 $n$人がランダムに帽子をかぶる。誰も自分の帽子でない確率。
解答完全順列。$\sum_{k=0}^n(-1)^k/k!\to 1/e$
12 排反と独立は同じか?
解答違う。排反は$A\cap B=\emptyset$、独立は$P(A\cap B)=P(A)P(B)$。
13 $A,B$独立で$P(A)=0.4,P(B)=0.5$。$P(A\cup B)$。
解答$0.4+0.5-0.2=0.7$
14 3人がじゃんけん、あいこになる確率。
解答全員同じ手$3/27$+全員違う手$3!/27=6/27$。和$=1/3$。
15 5枚から3枚選ぶ組合せ数。
解答$\binom{5}{3}=10$

B. 条件付き確率・ベイズ(問16〜30)

16 サイコロで「偶数」と「3以下」、共に起きる条件付き確率$P(\text{3以下}|\text{偶数})$。
解答偶数$=\{2,4,6\}$, その中で3以下は$\{2\}$。$1/3$
17 病気の有病率1%, 検査の感度99%, 偽陽性率5%。陽性と判定された人が実際に病気の確率は?
解答$\frac{0.01\cdot0.99}{0.01\cdot0.99+0.99\cdot0.05}\approx 0.167$(約17%!)
18 2つの壺。壺Aは赤3白2、壺Bは赤1白4。1つの壺を等確率で選び赤を引いた。Aから引いた確率は?
解答$\frac{(1/2)(3/5)}{(1/2)(3/5)+(1/2)(1/5)}=3/4$
19 3つの箱。それぞれ金/銀コイン2枚、銀/銀、金/金。1つから1枚出すと金。もう1枚も金の確率。
解答ベイズで $2/3$(ベルトランの箱の有名問題)
20 「2人子供のうち少なくとも1人が男」と分かったとき、両方男の確率。
解答$1/3$(誕生日順序付きで4通りのうち少なくとも1人男は3通り、両方男は1通り)
21 全確率の公式:$P(B)=\sum P(B|A_i)P(A_i)$ を述べよ。
解答分割$\{A_i\}$なら$P(B)=\sum_i P(A_i)P(B|A_i)$。
22 工場A,B,Cの生産比$0.5,0.3,0.2$。不良率$0.01,0.02,0.03$。不良品はAから来た確率。
解答分母$=0.5\cdot0.01+0.3\cdot0.02+0.2\cdot0.03=0.017$。$P(A|不)=0.005/0.017\approx 0.294$
23 連鎖律:$P(A\cap B\cap C)=P(A)P(B|A)P(C|A\cap B)$ を用い、5枚から赤3枚連続引く確率(赤2白3、戻さず)。
解答$\frac{2}{5}\cdot\frac{1}{4}\cdot 0=0$。あ、赤は2枚しかないので不可能。問題を「3枚中3枚赤」じゃなく赤2白3で再設定すれば$2/5\cdot1/4=1/10$(2枚連続)に変えるべき。
24 独立な事象$A,B$で$P(A^c\cap B^c)=P(A^c)P(B^c)$ を示せ。
解答$P(A^c\cap B^c)=1-P(A\cup B)=1-P(A)-P(B)+P(A)P(B)=(1-P(A))(1-P(B))$
25 ある国で迷惑メール率0.7。「無料」が含まれる確率は迷惑$0.5$, 普通$0.05$。「無料」入りメールが迷惑の確率。
解答$\frac{0.7\cdot0.5}{0.7\cdot0.5+0.3\cdot0.05}\approx 0.959$
26 $A\subset B$ なら$P(A|B)=P(A)/P(B)$ を示せ。
解答$A\cap B=A$ より定義から直接。
27 シンプソンのパラドックスの簡単例を作れ。
解答合計では女性合格率高いが、学部別では男性が高い、など(教科書参照)。
28 $P(A|B)P(B)=P(B|A)P(A)$ を示せ(ベイズ基本式)。
解答共に$P(A\cap B)$。
29 事象$A,B,C$ 互いに独立 ⇔ pairwise独立 か。
解答違う。pairwise独立でも3項独立とは限らない(反例あり)。
30 連続して3勝するか連続して3敗するまで続ける。各回独立で勝率$1/2$。3勝で終わる確率。
解答対称性で$1/2$。

C. 確率変数・期待値(問31〜50)

31 サイコロの目の期待値。
解答$3.5$
32 サイコロの分散。
解答$E[X^2]=91/6$, $V[X]=91/6-(7/2)^2=35/12$
33 $X\sim$Bin$(10,0.3)$ の期待値・分散。
解答$E=3, V=2.1$
34 $X\sim$Po$(\lambda)$ の積率母関数$M_X(t)=\exp(\lambda(e^t-1))$ を導け。
解答$\sum_{k=0}^\infty e^{tk}\frac{\lambda^k e^{-\lambda}}{k!}=e^{-\lambda}\sum\frac{(\lambda e^t)^k}{k!}=e^{-\lambda}e^{\lambda e^t}$
35 Po$(\lambda)$の$E[X]$と$V[X]$を$M_X$から。
解答$E[X]=M'(0)=\lambda$, $V[X]=M''(0)-M'(0)^2=\lambda$
36 サイコロ2個の和$S$の期待値・分散。
解答$E=7,V=70/12$
37 幾何分布で「初めて成功するまでの試行回数」の期待値(成功率$p$)。
解答$1/p$
38 $X\sim$Geo$(p)$, $E[X^2]$は?
解答$\frac{2-p}{p^2}$
39 連続$X$, 密度$f(x)=2x$($0\le x\le1$)の$E[X]$。
解答$\int_0^1 2x^2 dx=2/3$
40 $X\sim$U$(0,1)$ で$Y=-\log X$ の分布は?
解答指数分布Ex$(1)$
41 $X\sim$N$(0,1)$, $Y=X^2$ の分布。
解答$\chi^2(1)$分布
42 $X\sim$Ex$(\lambda)$, $E[X],V[X]$。
解答$1/\lambda$, $1/\lambda^2$
43 指数分布の無記憶性:$P(X>s+t|X>s)=P(X>t)$ を示せ。
解答$P(X>x)=e^{-\lambda x}$より$\frac{e^{-\lambda(s+t)}}{e^{-\lambda s}}=e^{-\lambda t}$。
44 標準正規分布の積率母関数。
解答$M_Z(t)=e^{t^2/2}$
45 $X\sim$N$(\mu,\sigma^2)$ なら$M_X(t)=\exp(\mu t+\sigma^2 t^2/2)$ を示せ。
解答$X=\mu+\sigma Z$ から$M_X(t)=e^{\mu t}M_Z(\sigma t)$。
46 $X,Y\sim$N独立。$X+Y$の分布。
解答$N(\mu_X+\mu_Y,\sigma_X^2+\sigma_Y^2)$(積率母関数の積)
47 $X,Y$独立で$X\sim$Po$(\lambda_1),Y\sim$Po$(\lambda_2)$なら$X+Y\sim$Po$(\lambda_1+\lambda_2)$ を示せ。
解答積率母関数を掛ける。
48 共分散の性質:$\mathrm{Cov}(aX,bY)=ab\mathrm{Cov}(X,Y)$ を示せ。
解答定義から直接。
49 独立 ⇒ 無相関、逆は成り立つか。
解答独立⇒無相関は成り立つ。逆は反例:$X\sim$U$(-1,1),Y=X^2$。$\mathrm{Cov}=0$だが従属。
50 線形変換$Y=aX+b$なら$\rho(X,Y)=\pm 1$。
解答$a>0$で$+1$, $a<0$で$-1$。

D. 確率分布の応用(問51〜70)

51 不良率3%の製品を100個。不良5個以下の確率(二項→正規近似)。
解答$\mu=3,\sigma^2=2.91$。$P(X\le5)\approx \Phi((5.5-3)/\sqrt{2.91})\approx\Phi(1.47)\approx 0.929$
52 1時間に平均5件の電話。1時間に8件以上の確率(ポアソン)。
解答$P(X\ge 8)=1-\sum_{k=0}^7\frac{5^k e^{-5}}{k!}\approx 0.133$
53 平均寿命1000時間の電球(指数)。500時間以内で壊れる確率。
解答$1-e^{-0.5}\approx 0.393$
54 $X\sim$N$(50,100)$ で$P(40\le X\le 60)$。
解答$\sigma=10$。$P(-1\le Z\le 1)\approx 0.683$
55 期末試験N$(60,15^2)$、上位10%の点数。
解答$60+1.28\cdot 15\approx 79.2$
56 二項Bin$(n,p)$ がポアソンPo$(\lambda)$ に近似するのは?
解答$n\to\infty,p\to0,np=\lambda$固定のとき。
57 1日に1万人が利用、確率$0.0001$で当選。当選者数の分布近似。
解答Po$(1)$。$P(0)=e^{-1}\approx 0.368$。
58 標準正規の上側0.025点。
解答$z_{0.025}=1.96$
59 一様U$(0,10)$ の累積分布関数。
解答$F(x)=x/10$($0\le x\le10$)
60 $X\sim$U$(0,1)$ の中央値・最頻値。
解答中央値$0.5$、最頻値はなし(密度一定)。
61 $X\sim$Ex$(1)$ で$Y=\sqrt X$ の密度関数。
解答変数変換 $f_Y(y)=2ye^{-y^2}$(レイリー分布)
62 一様U$(-1,1)$から$Y=X^2$の密度。
解答$f_Y(y)=\frac{1}{2\sqrt y}$($0
63 $\Gamma(\alpha,\beta)$ で$\alpha=1$なら?
解答指数分布Ex$(\beta)$
64 二項分布の最頻値(mode)。
解答$\lfloor (n+1)p\rfloor$
65 ポアソン分布の最頻値。
解答$\lfloor\lambda\rfloor$($\lambda$整数なら$\lambda-1$と$\lambda$)
66 二変量正規で相関$\rho=0$ なら独立を示せ。
解答密度関数が積に分解できる。
67 $X,Y$同時密度$f=2$ ($0解答$\int_x^1 2\,dy=2(1-x)$($0
68 上の問題で$E[X|Y]$。
解答条件密度$f(x|y)=1/y$($0
69 全期待値の法則:$E[X]=E[E[X|Y]]$ を示せ。
解答$E[E[X|Y]]=\int E[X|y]f_Y(y)dy=\int\int xf(x|y)f_Y(y)dxdy=E[X]$。
70 $X\sim$U$(0,1),Y|X\sim$U$(0,X)$ の$E[Y]$。
解答$E[E[Y|X]]=E[X/2]=1/4$

E. CLT・推定・検定(問71〜100)

71 サイコロ100回振った和の近似分布。
解答$N(350,100\cdot35/12)\approx N(350,291.7)$
72 サイコロ100回の平均が3.7以上の確率。
解答$Z=(3.7-3.5)/\sqrt{35/1200}\approx 1.17$。$1-\Phi(1.17)\approx 0.121$
73 チェビシェフの不等式:$P(|X-\mu|\ge k\sigma)\le 1/k^2$ を述べよ。
解答分散の存在のみで成立。
74 $X\sim$N$(0,1)$ で$P(|X|\ge 3)$ をチェビシェフで上から評価。
解答$\le 1/9\approx 0.111$(実際は$0.0027$なので甘い)
75 標本$n=25$, $\bar X=10,s=2$のとき母平均の95%信頼区間($\sigma$未知)。
解答$t_{0.025,24}\approx 2.064$。$10\pm 2.064\cdot 2/5=[9.17,10.83]$
76 $n=100,\bar X=50,\sigma=10$ 既知。$\mu$の95%CI。
解答$50\pm 1.96\cdot 1=[48.04,51.96]$
77 母比率$p$の信頼区間(大標本)。
解答$\hat p\pm z_{\alpha/2}\sqrt{\hat p(1-\hat p)/n}$
78 1000人中支持者600人。支持率の95%CI。
解答$0.6\pm 1.96\sqrt{0.6\cdot0.4/1000}=[0.570,0.630]$
79 正規母集団から$n=10$, $s^2=4$。$\sigma^2$の95%CI。
解答$\chi^2_{0.025,9}=19.02,\chi^2_{0.975,9}=2.70$。$[9\cdot 4/19.02,9\cdot 4/2.70]=[1.89,13.33]$
80 Bernoulli$(p)$ から$X_1,\ldots,X_n$。$p$のMLE。
解答$\hat p=\bar X$
81 N$(\mu,\sigma^2)$、両方未知のときMLE。
解答$\hat\mu=\bar X,\hat\sigma^2=\frac{1}{n}\sum(X_i-\bar X)^2$(不偏ではない!)
82 Po$(\lambda)$ のMLE。
解答$\hat\lambda=\bar X$
83 Ex$(\lambda)$のMLE。
解答$\hat\lambda=1/\bar X$
84 U$(0,\theta)$ のMLE。
解答$\hat\theta=\max X_i$
85 有意水準5%、$n=25,\bar X=52,\sigma=10$。$H_0:\mu=50$ vs $H_1:\mu\neq50$ の検定。
解答$Z=(52-50)/(10/5)=1$。$|1|<1.96$ なので採択。
86 $p$値の意味を一言で。
解答$H_0$下で観測以上に極端な値が出る確率。
87 第1種誤り・第2種誤りの定義。
解答第1種:$H_0$真なのに棄却($\alpha$)。第2種:$H_0$偽なのに採択($\beta$)。
88 検出力 $1-\beta$ を上げる方法は?
解答$n$を増やす、$\alpha$を緩める、効果サイズが大きい場合は自然に上がる。
89 2標本$t$検定:$n_1=n_2=10,\bar X_1-\bar X_2=3,$プール標準偏差$=4$。$t$値。
解答$t=3/(4\sqrt{1/10+1/10})=3/(4\cdot\sqrt{0.2})\approx 1.677$
90 適合度検定:サイコロ60回で出目$(8,12,11,9,10,10)$。一様性を$\alpha=0.05$で検定。
解答$E_i=10$, $\chi^2=\sum(O-E)^2/E=(4+4+1+1+0+0)/10=1.0$。$\chi^2_{0.05,5}=11.07$。採択。
91 Cramér-Rao不等式:不偏推定量$\hat\theta$ なら$V[\hat\theta]\ge 1/I(\theta)$。$I(\theta)$は?
解答フィッシャー情報量。$I(\theta)=E[(\partial\log f/\partial\theta)^2]$。
92 N$(\mu,\sigma^2)$の$\mu$($\sigma^2$既知)に対するフィッシャー情報量。
解答$I(\mu)=n/\sigma^2$。$\bar X$は分散$\sigma^2/n$でCR下限を達成。
93 線形回帰$Y=\beta_0+\beta_1 X+\varepsilon$ の最小二乗推定量。
解答$\hat\beta_1=\dfrac{\sum(X_i-\bar X)(Y_i-\bar Y)}{\sum(X_i-\bar X)^2}$, $\hat\beta_0=\bar Y-\hat\beta_1\bar X$
94 決定係数$R^2$ の定義。
解答$R^2=1-\dfrac{\sum(Y_i-\hat Y_i)^2}{\sum(Y_i-\bar Y)^2}$
95 $X\sim$N$(0,1)$ 独立$n$個の二乗和は何分布。
解答$\chi^2(n)$
96 $T=Z/\sqrt{V/n}$($Z$標準正規, $V\sim\chi^2(n)$独立)の分布。
解答$t(n)$分布
97 $F=(V_1/n_1)/(V_2/n_2)$ の分布。
解答$F(n_1,n_2)$分布
98 $X_1,\ldots,X_n\sim$N$(\mu,\sigma^2)$ iid。$\bar X$と$s^2$は独立を示せ(コクランの定理)。
解答正規分布の特殊性。$\bar X$と$X_i-\bar X$の共分散ゼロ+正規→独立。
99 一致性:$\hat\theta_n\xrightarrow{P}\theta$ の十分条件。
解答不偏かつ$V[\hat\theta_n]\to 0$ で十分(チェビシェフから)。
100 ベイズ推定:尤度Bin$(n,p)$, 事前Be$(\alpha,\beta)$ なら事後分布は?
解答Be$(\alpha+x,\beta+n-x)$(共役事前分布)
[AdSense レスポンシブ]

📦 PDF版(演習200問+詳解)¥980

noteで購入