信頼区間

信頼区間とは

これは統計に使用される範囲の推定値であり、母集団パラメータが含まれています。 この未知の母集団パラメータは、収集されたデータから計算されサンプルモデルを通して見つけられます

例:x - 収集されたサンプルの平均は、真の母集団平均μと一致する場合と一致しない場合があります。 このために、この母集団の平均を含めることができる範囲の標本平均の範囲を検討することが可能です。 この間隔が長いほど、これが発生する可能性が高くなります。

信頼区間はパーセンテージで表され、信頼水準で表示されます。90%、95%、および99%が最も重要です。 たとえば、次の図では、上限と下限(a と-a )の間に90%の信頼区間があります。

上限(a)と下限(-a)の間の90%信頼区間の例。

信頼区間は、不確実性の尺度として使用されるため、統計学における仮説検定の中で最も重要な概念の1つです。 この用語は、1937年にポーランドの数学者および統計学者のJerzy Neymanによって導入されました。

信頼区間の関連性は何ですか?

信頼区間は、行われた計算に対する不確実性のマージン(または不正確さ)を示すために重要です。 この計算では、調査サンプルを使用して、ソース母集団内の結果の実際のサイズを推定します。

信頼区間の計算は、エラーサンプリングを考慮した戦略です。 あなたの研究の結果の大きさとあなたの信頼区間は、元の母集団の推定値を特徴付けるものです。

信頼区間が狭いほど、調査母集団のパーセンテージがソース母集団の実数を表す確率が高くなり、調査対象の結果に関する確実性が高まります。

信頼区間の解釈方法

信頼区間の正しい解釈は、おそらくこの統計的概念の最も困難な側面です。 この概念の最も一般的な解釈の例は次のとおりです。

将来、母集団パラメータの真の値(例、平均)がX (下限)からY (上限)の範囲に入る可能性95%です。

したがって、信頼区間は次のように解釈されます。X(下限)とY(上限)の間の区間に母集団パラメータの真の値が含まれることは95%の信頼度です。

X(下限)とY(上限)の間の区間に母集団パラメータの実際の値が含まれる可能性は95%あります。

上記の説明は、信頼区間に関する最も一般的な誤解です。 統計的範囲が計算された後は、母集団パラメータのみを含めることも、含めないこともできます。

ただし、間隔はサンプル間で異なる場合がありますが、真の母集団パラメーターはサンプルに関係なく同じです。

したがって、信頼区間信頼ステートメントは、信頼区間がサンプル数に対して再計算された場合にのみ作成できます。

信頼区間を計算する手順

範囲は次の手順で計算されます。

  • サンプルデータを収集します。
  • 標本平均xを計算します
  • 母集団の標準偏差( σ )が既知か未知かを判断します。
  • 母集団の標準偏差がわかっている場合は、対応する信頼水準にz点を使用できます。
  • 母集団の標準偏差がわからない場合は、対応する信頼水準に統計量tを使用できます。
  • したがって、信頼区間の下限と上限は次の式を使って求められます。

a) 既知の母集団の標準偏差

既知の母集団の標準偏差を計算するための式。

b) 未知の母集団の標準偏差

未知の母集団の標準偏差を計算するための式。

信頼区間の実例

臨床試験では、成人における喘息の存在と閉塞性睡眠時無呼吸の発症リスクとの関連性が評価されました。

何人かの大人は無作為に4年間追跡されるために州の役人のリストから募集されました。

喘息のある参加者は、そうでない参加者と比較すると、4年間で無呼吸を発症する危険性が高かった。

この例のように臨床研究を行う際には、通常、研究効率を上げるために関心のある母集団のサブセットが採用されます(より少ないコストとより少ない時間)。

以下の図に示すように、このサブグループの個人、調査対象集団は、選択基準を満たし、調査に参加することに同意した個人で構成されています。

例で調べた母集団の説明図。

その後、研究は完了し、研究の質問に答えるために効果の大きさ(例えば、 平均差または相対リスク )が計算されます。

推論と呼ばれるこのプロセスでは、調査対象の母集団に対する実際の影響の大きさ、つまり出身の母集団のサイズを推定するために、調査対象の母集団から収集されたデータを使用します。

与えられた例では、研究者は、研究に参加することに適格であり、同意することに同意した無作為の州の職員(出典集団)を募集し、喘息が研究集団において無呼吸を発症するリスクを高めると報告した。

関心のある集団のサブグループのみの採用によるサンプリング誤差を説明するために、彼らはまた95%の確率を示す1.06 - 1.82の95%信頼区間 (推定値周辺)を計算した。 線源集団の真の相対リスクは1.06から1.82の間であるという割合

平均の信頼区間

母集団の標準偏差の情報があれば、その母集団の平均または平均の信頼区間を計算できます。

測定されている統計的特性(収入、IQ、価格、身長、数量、体重など)が数値の場合、ほとんどの場合、母集団の平均値が見つかると推定されます。

したがって、誤差の余裕のある標本平均( x ^ )を使用して母集団平均( μ )を見つけようとします。 この計算の結果は、母集団平均の信頼区間と呼ばれます。

母集団の標準偏差がわかっている場合、母集団の平均に対する信頼区間(CI)の式は次のとおりです。

どこで:

  • xは標本平均です。
  • σは母集団の標準偏差です。
  • nはサンプルサイズです。
  • Ζ*は、希望する信頼水準に対する標準正規分布の適切な値を表します。

以下は、さまざまな信頼水準( Ζ* )の値です。

信頼レベルZの値* -
80%1.28
90%1.645(従来型)
95%1.96
98%2.33
99%2.58

上の表は、提供されている信頼水準のz *値を示しています。 これらの値は標準正規分布(Z-)から得られることに注意してください。

各z *値とこの値の負の値の間の面積は、(近似の)信頼率です。 例えば、z * = 1.28とz = -1.28の間の面積は約0.80です。 したがって、この表は他の信頼率にも拡張できます。 この表は、最も一般的に使用されている信頼の割合のみを示しています。

仮説の意味も参照してください。