생물통계학

농업직 연구사 공무원, 생물학 등 생물통계학 핵심 요점 정리 8. 모수추정

롤라❤️ 2022. 11. 16. 09:49
반응형

제8장 모수추정


<학습개요>
추측통계는 표본에서 얻은 통계량을 통해 모집단의 모수를 추측하는 것이다. 이 때 두가지 문제가 발생하는데 하나는 모수에 대한 추정을 얼마나 신뢰할 수 있는지 이고, 다른 하나는 모수와 통계량간의 차이가 참인지 우연인지 하는 것이다. 이와같은 문제 가운데 첫 번째는 모수의 신뢰구간을 설정하여 해결하고, 두 번쨰 의문은 가설검정을 통해 해결한다. 신뢰구간은 모수를 포함할 것으로 기대되는 표본통계량의 구간을 말한다. 신뢰구간 추정과 가설검정은 정규분포와 t-분포 및 x2-분포를 이용한다.
제8장에서는 평균, 비율과 분산에 대한 점추정 및 구간추정에 대한 개념과 계산방법에 대해 살펴본다

○ 통계추론이란 그 모집단으로부터의 표본에 근거하여 모집단에 대한 정보를 알아내는 과정이다. 통계추론은 추정과 가설검정으로 구분된다.
○추정과 검정의 예
-A강 댐과 B강 댐의 수질을 비교한 결과 수질오염도 수치에 의미있는 차이가 있는지?
- 새로개발된 치료제가 기존치료방법 보다 생존기간에 효과 더 있는지?

󰏚추정 종류 및 검정의 뜻
○점추정 : 미지의 모수 Θ에 가장 가까우리라고 생각되는 하나의 값을 표본으로부터 구하는 것
○구간추정 : 모수의 참값이 속할 것으로 기대되는범위를 추정하는 것(하한:L, 상한:U)
○검정 : 모집단의 특성에 대한 가설을 설정한 뒤 표본관찰을 통하여 그 가설에 대한 채택여부를 결정하는 통계적 분석방법
󰏚추정관련 용어 정의
○추정(estimation): 통계량을 통해 모수의 값을 추측하는 것
○추정량(estimator): 추정하는 값을 구하는 공식 : 예) 평균, 표준편차 등
○추정값(estimate): 추정량에 의해 추정한 값 : 예) 키 평균, 174cm, 표준편차 7.4cm 등

󰏚확률분포
-생물통계에서 대상으로 하는 변수, 즉 생물적 현상의 변화 경향은 특정한 확률분포로 설명된다 .
○이항분포 B(n, p) : 결과가 두 가지로만 나타나는 변수
○포아송분포 P(m) : 희귀사건의 확률분포
○정규분포N( 𝜇, 𝝈𝟐) :대부분의 생물적 현상
󰏚표본분포
-모수와 통계량 간의 관계를 설명하는데 이용

󰏚표본 통계량으로 모수를 추정할 때 고려사항
-모수에 대한 추정값을 얼마나 신뢰할 수 있는가 ?, 통계량과 모수 사이의 차이가 참인가 우연인가 ?
○신뢰성 의 문제 : 모수의 신뢰구간을 추정하여 해결(모수추정 )
○참과 우연 의 문제 : 가설검정으로 해결
8.1 점추정과 구간추정 : 모수와 통계량 간의 관계를 설명하는데 이용
󰏚 불편추정량(不偏推定量, Unbiased Estimate) 조건 : 불편의성, 효율성, 일치성
① 불편성(unbiasedness) :

• 모든 가능한 표본에서 얻은 추정량의 평균, 즉 기대값은 추정하고자 하는 모수의 값과 같아야 한다.
•모평균의 추정량인 표본평균의 기대값은 항상 모평균과 같다는 의미이다.
• 표본평균은 모평균에 가장 좋은 추정량이다.
② 효율성(efficiency)
•추정량의 분산은 가능한 한 작을수록 좋다. •모평균의 추정량인 표본평균의 기대값은 항상 모평균과 같다는 의미이다.
• 표본평균은 모평균에 가장 좋은 추정량이다.
② 효율성(efficiency)

•추정량의 분산은 가능한 한 작을수록 좋다.
•표본평균의 분산은 중앙값의 분산보다 작으므로 표본평균의 효율성이 더 높다.
③ 일치성(consistency)
•표본의 크기가 커질수록 추정값과 모수의 값이 거의 같아지는 성질이다.

󰏚 점추정 : 나의 값으로 모수를 추정하는 것을 점추정(point estimation)이라 한다.
• 점추정은 한 개의 값으로 나타내기 때문에 간단하고 알기 쉽다 .
• 그러나, 표본추출에 따르는 표본오차가 있고 , 또한 평균과 분산은 표본크기(n)의 영향을 받기 때문에 단정적으로 말할 수 없다 .

󰏚 구간추정 (interval estimation) : 모수를 포함할 것으로 기대되는 구간을 찾는 것
예8-2) 벼품종 A의 평균키(간장)에 대한 95% 신뢰구간이 (65.5, 73.6)일 때, 이는"A품종의 평균키는 65.5cm~73.6cm에 있으며, 그 사이에 있다는 것을 95% 확신한다"는 뜻이다. 95%신뢰구간은 추정이 얼마나 정밀하게 이루어졌는지 (65.5~73.6c)를 알 수 있고, 또한 추정값이 주어진 두 값 사이에 있을 것으로 확신하는 정도(95%)가 얼마인지도 알 수 있다 .
○ 신뢰구간(confidence interval): 모수를 포함할 것으로 기대되는 표본통계량의 구간
- 모집단에서 n번의 표본을 추출했을 때, 그 표본이 모평균을 포함하고 있는 구간
- 모집단에서 표본을 추출했을 때, 그 표본이 모집단을 대표할 수 있는지 파악하는 용도로 사용.
○ 신뢰수준(reliability level) : 신뢰구간이 모수를 포함할 것으로 확신하는 정도를 나타내는 확률
-신뢰수준은 미리 정하며, 일반적으로 95% 또는 99%로 하면 1-α로 표현하다.
-신뢰구간이 실제로 모수(모평균)을 포함하게 되는 정도
※ 95% 신뢰수준
•한 모집단으로부터 계속 표본을 취해 얻은 100개의 신뢰구간 중 95개의 신뢰구간은 모수를 포함한다는 뜻
8.2 모평균의 신뢰구간 추정
󰏚 정규분포를 이용한 신뢰구간 추정
1) 모평균의 신뢰구간 추정
○표본의 크기가 30 이상인 대표본은 정규분포를 이용한다.
○표본의 크기가 30 미만인 소표본은
–분포를 이용한다.
2) 정규분포를 이용한 신뢰구간 추정식

󰏚 t –분포를 이용한 신뢰구간 추정
○ 모분산을 모르고 소표본인 경우, 모평균의 신뢰구간 추정식

󰏚 신뢰구간의 해석
○모평균은 상수로 고정된 값이다.
○그러므로 모평균은 이동하는 것이 아니며 신뢰구간 안이나 밖에 존재할 뿐이다.
○따라서 “신뢰구간 내에 모평균이 포함될 확률이 95%(또는 99%)”라고 표현하는 것은 바르지 못하며,
○ “신뢰구간이 모평균을 포함할 확률이 95%(또는 99%)”라고 표현해야 한다.
- 구한 구간이 모평균 μ를 포함할 것을 95% 확신한다는 것이다.
※ 신뢰구간(C. I) : 구간추정을 통하여 얻어지는 구간,

- 신뢰수준(C. L) : 신뢰구간이 추정하고자 하는 모수를 포함할 확률
󰏚 신뢰구간과 추정의 정확도
- 모평균의 신뢰구간은 표본평균을 중심으로 좌우대칭이며, 신뢰수준이 높을 질수록 신뢰구간의 폭이 넓어진다. 신뢰도를 높이면 신뢰구간의 폭이 넓어져서 추정의 정확도가 낮아진다는 것을 의미한다
-신뢰구간을 좁히려면 표준오차를 감소시키거나, 분모인 표본크기를 n을 증가시켜야 한다. 표준편차나 모표준편차를 줄이는 것은 쉬운 일이 아니어 표본크기 n을 증가시켜한다. 표본크기 n이 증가할수록 표준오차는 감소한다.

○모평균에 대한 신뢰의 정확도를 높이기 위해서는
‧신뢰구간을 작게한다
‧그러기 위해서는 표준오차의 값이 작아야 하면
‧결국 표본크기 n을 증가시켜야 한다
○n이 무한대일 때 표준오차와 신뢰구간은 0이 된다
8.3 모분산의 신뢰구간 추정

○ 모분산의 신뢰구간은 모평균과 달리 표본분산을 중심으로 좌우대칭이 아니다

8.4 표본크기의 결정
○ 통계는 표본을 대상으로 하며
○ 표본의 크기가 커야 오차가 적다
○ 그러나 표본의 크기가 클수록 데이터 수집에 비용과 시간이 많이 소요된다
󰏚 표본크기
○표본크기 n이 커지면 데이터의 수집비용과 시간이 많이 들므로 추정의 정확도와 신뢰도에 영향을 주지 않는 최소한의 표본크기를 결정하는 것이 중요하다.
○Z-분포(정규분포)와 허용오차를 이용하여 표본크기를 결정하는 방법을 살펴본다
󰏚 표본크기 계산

󰏚 오차한계 : 오차한계는 연구자가 결정한다

<정리하기>
1.추정은 통계량으로 모수값을 추측하는 것이고, 추정량은 추정값을 구하는 공식을 말한다. 불편추정량은 불편성‧효율성‧일치성을 갖추어야 한다.
2.점추정은 하나의 통계량값으로 모수를 추정하며, 구간추정은 모수를 포함할 것으로 추측되는 통계량값의 구간을 추정한다.
3. 모수에 대한 95%(또는 99%) 신뢰구간은 95%(또는 99%)의 확률로써 모수를 포함할 수 있는 표본통계량의 구간이다.
3. 모분산을 알고, n󰀄30일 때 모평균의 신뢰구간 추정은 정규분포를 이용하며, 모분산을 모르고 n≤30일 때 모평균의 신뢰구간은 t-분포를 이용한다. 또한 모분산에 대한 신뢰구간 추정은 x2-분포를 이용한다.



※ 부족하지만 글의 내용이 도움이 조금이라도 되셨다면, 단 1초만 부탁드려도 될까요? 로그인이 필요없는 하트♥(공감) 눌러서 블로그 운영에 힘을 부탁드립니다. 그럼 오늘도 행복한 하루 되십시오^^

반응형