본문 바로가기
보건학 관련

통계학13(연구설계2)

by 비버닷 2024. 1. 31.

변동(variation) 

자료가 변동을 보이는 이유는 생물학적 요인 (예를 들면 성별, 연령 등) 측정 오차(error)’혹은 설명 이 불가능한 무작위 변동(unexplained random variation) 이 복합적으로 작용하기 때문이다. 자료의 변동이 모수를 추정하는 데 미치는 영향력의 크기는 표준오차로 측정한다. 변수 측정값들의 변동이 심하면 해당 변수와 관련된 추정값들은 정밀하지 않은 추정값이 될 것이고, 그로 인해 표준오차는 더 커지게 된다. 따라서 좀 더

정밀한 추정값을 얻기 위해서는 가능한 한 이 변동의 영향력을 줄이도록 노력해야만 할 것이. 즉 자료에는 변동이 수반되게 마련이지만, 다음과 같은 전략들을 사용한다면 이 변동이 결과에 미 치는 영향력을 줄일 수 있다.

 

반복(replication)의 사용

 

좀 더 정밀한 추정값을 얻는 방법 중 하나는 반복을 실시하는 것이다. 모든 연구대상자들로부터 해당 변수와 관련해 두 개 이상의 측정값을 얻는 것을 반복이라 한다.) 그런데 반복측된 자료들은 서로 독립적이지 않기 때문에 통계분석을 할 때 이를 반영해야 한다. 반복측정된 자료를 다루는 가장 쉬운 방법은 원자료 대신 반복측정된 값들을 평균 낸 뒤, 이 평균을 분석에 사용하는 방법이다. 다른 대안으로는 반복측정된 자료를 다루기 위한 목적으로 특별히 개 발된 통계분석 방법들을 사용하는 것이다.

 

표본 (samp|e size) 계산

 

연구 설계 시 중요한 사항 중 하나는 연구에 적절한 표본 수를 산출하는 작업이다. 표본 수가 커지면 추정값의 표준오차는 작아지게 되고, 따라서 추정값의 정밀성 및 연구의 검정력 (power)이 높아지게 된다. 표본 수 계산은 반드시 연구를 시작하기 전에 이루어져야만 한다.

연구의 종류와 상관없이, 충분한 검정력 (18 )이 보장되기 위해서는, 최종 분석에 사용되는 표본 수가 연구시작 시에 계획된 표본 수와 가능한 한 같아야 할 것이 다. 이는 곧 반응률 (response rate) 이 적어도 단면연구나 설문조사 연구에서 관찰되는 반응률보다는 높아야 한 다는 것을 의미한다. 따라서 임상시험이나 코호트 연구의 경우, 추적실패율이 가능한 한 최소가 되도록 노력해야만 한다; 이러한 노력은 군 별로 무응답률이 르거나 코호트 탈락률이 다르게 되는 경우에 발생하게 되는 편향의 크기를 감소시키는 데에도 도움이 된다.

 

특별한 형태의 설계방법을 사용

 

단순한 형태의 연구 설계를 수정해 조금 복잡한 형태로 바꾸면 변동의 영향력을 줄여 보다 정밀한 추정값을 얻을 수 있다. 기본적으로 연구자는 실험단위 (experimental unit)들에 적용되는 하나 이상의 처리 (treatment)들을 비교하게 된다. 실험단위란 자료 분석 시 서로 독립적인 값으로 간주될 수 있는 개체 혹은 개체들로 이루어진 최소 크기의 집단을 의미한다. 예를 들어 각 환자, 혈액량, 피부 부착포, 치아 등이 실험단위가 될 수 있다. 실험단위를 처리에 무작위로 (, 우연하게) 배정한, 그리고 기타 다른 제약조건들은 없는, 실험설계는 완전확률화설계 (completely randomized design)라 한다. 이 설계는 분석 이 매우 간단하다는 장점

이 있지만, 반면에 만일 실험단위들 간에 상당한 양의 변동이 존재한다면 매우 비효율적인 설계이다. 이러한 경우에는 블록화(blocking)를 실시하거나 또는 교차설계 (cross-over design)를 사용해 실험단위들 간 변동이 분석결과에 미치는 영향력을 줄일 수 있다.

 

블록화(blocking)

 

비슷한 특성을 가지는 일련의 실험단위들을 동질적인 블록(block)이나 (stratum)으로 묶는. (예를 들면 각 연령대가 하나의 블록이 되도록 구성한다.) 이렇게 하면 동일 블록 내의 실험단위들 간 변동은 서로 다른 블록에 속하는 실험단위들 간 변동보다 작게 될 것이다. 다음으로 각 블록 내에서 개체들을 처리에 무작위로 배정한다. 처리들 간 비교는 모든 개체들을 대상으로 전체적인 비교를 하는 것이 아니라, 먼저 각 블록 내에 있는 개체들을 대상으처리들 간 비교를 한 뒤 이 비교 결과들을 모든 블록에 대해 결합(pooling) 하는 방식으로 진 행한다. 따라서 블록회를 하면, 블록화를 하지 않는 경우에 비해, 처리들 간 비교를 좀 더 정 밀하게 할 수 있다.

 

병행설계(parallel design)와 교차설계(cross-over design) 

 

일반적으로 우리는 서로 다른 두 집단에 속한 개체들을 상호 비교하는 연구를 실시하게 된다. 예를 들면 대부분의 임상시험은 각 환자들을 연구자가 비교하고자 하는 두 개 (또는  이상)의 처리들 중 하나에 배정한 뒤, 이들을 서로 비교하는 병행설계를 사용하게 되는데, 는 곧 개체-간 비교 (between-individual comparison)에 해당한다. 보통은 서로 다른 개체들 간에 얻어지는 측정값들 간의 변동보다 각 개체 내에서 얻어지는 측정값 간의 변동이 상대적으로 더 작기 때문에  스스로를 자신의 대조군으로 시용­(self-control) 하는 것이 좀 더 효과적인 경우가 있다. 이러한 개체-내 비교 (within-individual comparison)는 개체-간 설계보다 더 정밀한 비교를 할 수 있게 해 준다. 달리 표현하자면 상대적으로 더 적은 수의 개체(표본)들을 사용해도 개체-간 설계와 동일한 크기의 정밀성을 유지할 수 있게 된다. 임상시험에서 사용되는 개체-내 비교의 한 예가 바로 교차설계이다. 두 개의 처리를 비교하는 경우, 각 사람들은 두 개의 처리를 모두 받도록 한다. 이때 시간 적 전후 효과를제거하기 위해 두 개의 처리를 받는 순서는 무작위로 결정한다. 또한 각 처리를 받는 시 점 사이 에는 먼저 받은 처 리로 인해 남아 있을지도 모르는 잔류효과(carry-over effeet)를 없애기 위해 충분한 간격의 세정기간(washoutperiod)을 둔다. 이제 각 사람으로부터 얻어진 두 개의 반응값 차이를 사용해 처리 간 비교를 실시한다. 교차설계는 치료를 목적으로 하는 처리들이 아니라 증상을 일시적으로 완화시켜 주는 처리들을 비교하고자 하는 경우에만, 그리고 해당 처리에 의한 반응의 지속 시간이 너무 길지 않은 경우에만 사용될 수 있는

실험설계이다.

'보건학 관련' 카테고리의 다른 글

통계학15(임상시험1)  (3) 2024.02.03
통계학14(연구설계3)  (0) 2024.02.01
통계학12(연구설계1)  (2) 2024.01.31
통계학11(신뢰구간)  (2) 2024.01.31
통계학9(자료의 변환)  (3) 2024.01.31