推定と検定

ふわふわが解消されつつあるがはっきりとは分からない。
気をつけたい点を中心に軽くメモ。

推定

得られた標本(sample)を元に母集団の母数(平均や分散等の母集団を特徴づける値)を推定する。
・値を推定:点推定
・何%の確率でどの範囲にいるのか推定:区間推定
以下全て母集団が正規分布に従うとする。
標本数:
標本平均:
不偏分散:

区間推定
  1. 母平均の区間推定(は未知)
    確率変数

    とすると, は自由度分布に従う。
  2. 母平均の区間推定(は既知)
    確率変数

    とすると, は標準正規分布に従う。
  3. 母分散の区間推定(は未知)
    確率変数

    とすると, は自由度分布に従う。

@疑問点
に関して推定する訳だからなぜなのか, 符号的にが適切ではないか。
有意水準を定めて

とする訳なので両者は同値。もし, の推定をするとなったら面倒くさいことになるが基本的に無い? また, 検定における検定統計量を定めることを考えると↑の定め方でないと面倒くさいことになる。

が未知な状態と既知な状態で持っている情報量に差があるわけだからの信頼区間は狭くなるのか
確かめたい。

検定

手順

  1. 母数に関する仮説を立てる。
  2. 検定統計量を定める。(推定の確率変数と同じ)
    例えば, 仮説がだとすると,

    とする。
  3. 検定統計量が従う分布から棄却域を定める。
  4. 検定統計量の実現値(実際に標本平均に代入した値)を求める。
  5. ならば仮説は棄却される。
    ならば仮説は棄却されない。

@注意&疑問
・先の推定では母数であるについて考えたが, 今回では逆でが果たして仮説を棄却するかを確かめている。その意味では適切。
・検定では有意水準を低くとる。その意味で棄却を前提としており, 棄却されない採用とはいかない。
・ある仮説を採用したいとき, 例えばを採用したいとなれば, この仮説の否定を右側検定する(すなわち, が有意水準の確率で以上であるとき, (=棄却される)かどうかを推定する)。このとき, を帰無仮説, を対立仮説という。(棄却する=対立仮説を採用する前提の元立てる仮説なので帰無仮説, 帰無仮説と対するものなので対立仮説。)
・示したいことを背理法で示す的な目的でこの理解し難い面倒なシステムが構築されたらしい。また, 帰無仮説が棄却されたにも関わらず対立仮説が誤りであることを”第◯の誤り”と呼んだりするらしい。
・シンプルにを保証したいなら保証率みたいな形でを定めてとなる確率が以上となるを出せばいいのにと思うのだが, (コンピュータで近似値が出せるはず)分布表に汎用性が無くなるからなのか等考えています。