본문 바로가기
보건학 관련

통계학17(코호트 연구)

by 비버닷 2024. 2. 10.

코호트 연구(cohort study) 란 특정 병인학적 요인에 노출되는 것이 질병 발생에 어떤 영향을 미치는지를 파악하기 위한 목적으로, 동일한 특성을 가진 일련의 연구대상자 집단(이를 코호트라 한다)을 시간의 흐름에 따라 (일반적으로는 앞 방향으로) 조사해 나가는 연구이다. 만일 어떤 요인에 노출되는 것이 질병 발생에 영향을 미치는 것으로 밝혀진다면, 이 요인은 해당 질병에 관한 위험요인(risk factor)인 것으로 간주한다. 예를 들어 체중 조절 관련 요인들과 암 발생 간의 관련성에 대해 조사한 코호트 연구들을 생각해 보자. 대부분의 코호트 연구가 전향적 연구이간 하지만, 가끔 역사적 코호트(historical cohort)가 사용되기도 한다: 이 역사적 코호트를 사용하는 연구는 후향적 코호트 연구로, 노출 여부와 해당 결과에 관한 현 시점까지의 정보들을 의무기록이나 연구대상자의 기억을 토대로 확인하게 된다. 이 연구는 전향적 코호트 연구에 비해 일반적으로 수행하기 쉽고 빠르며 비용도 적게 든다. 그러나 역사적 코호트에서 얻어지는 정보는 신뢰성이 낮기 때문에 질이 낮은 연구에 해당한다. 코호트 연구는 고정 코호트(fixed cohort)와 역동적 코호트(dynamic cohort) 연구로 구분 
할 수 있다. 연구대상자가 코호트를 떠나는 경우에 이를 새로운 연구대상자로 대체하지 않으면 이를 고정 코호트 연구라 한다. 반면에 코호트에서 탈락하는 연구대상자가 생길 때 이를 자격조건을 갖춘 다른 사람으로 대체하면 역동적 코호트 연구가 된다. 이번 글에서는 코호트 연구의 주요 특성들에 대해 다루기로 한다. EQUATOR network에서 제공하는 연구결과 보고 가이드라인 중 하나인 STROBE statement는 관찰 
연구, 특히 코호트 연구, 사례-대조 연구  및 단면연구 등의 결과보고서 질을 향상하기 위한 목적으로 개발된 권고 사항들이다.

 

코호트(cohort) 의선택 

 

코호트는 연구결과를 일반화하고자 하는 대상 인구집단을 대표할 수 있는 것이어야 한다. 만일 연구대상지를 동일한 특성을 지닌 집단(예를 들면 공무원이나 의료종사자 등과 같은 특정 직업군)에서 모으면 해당 직업군에 관한 자료로부터 사망률이나 이환율과 같은 정보를 쉽게 얻을 수 있을 뿐만 아니라, 필요한 경우 대상자들을 다시 접촉하기 용이하다는 점 둥 여러 가지 장점이 있다. 하지만 이런 코호트는 일반 인구집단을 대표하지 못할 수도 있고, 오히려 일반 인구집단보다 더 건강한 사람들로 구성될 수도 있다. 반면에 일차진료병원의 의무기록을 토대로 코호트를 모집한다면 연구대상자들이 다양한 건강상태를 가진 사람들로 구성될 수 있다는 장점이 있긴 하지만, 거주지역이 거의 동일할 것이기 때문에 서로유사한 사회경제적 수준을 보이게 될 것이다. 
질병에 대한 위험요인의 병인학적 효과를 평가하고자 한다면 코호트를 연구 시작 시점에 해당 질병과는 무관한 사람들로 구성해야 한다. 이는 곧 해당 위험요인에의 노출이 관심사건 발생 이전에 이루어져야 하고, 따라서 해당 요인이 질병의 원인이 될 수 있는 가능성이 있어야 한다는 의미이다. 건강한 사람들을 대상으로 연구가 실시된다면 종종 건강인 진입효과(healthy entrant effect), 즉, 연구대상자들이 연구 초반에 보여주는 사망률이 일반 인구집단에서 기대되는 사망률보다 더 낮게 되는 현상이 나타날 수 있다. 만일 연구 시작 후 몇 년 
이내에 사망률이 갑자기 증가하게 된다면 이러한 효과가 있었을 가능성이 높다. 

 

 연구대상자들의 추적(fol|ow-up) 

 

연구대상자를 시간에 따라 추적조사 할 때에는 언제나 추적실패 (lost to follow-up) 사건들이 발생하기 마련이다. 연구대상자들은 연락처를 남기지 않은 채로 이사를 가기도 하고) 연구에 더 이상 참여하지 않기로 결정하기도 한다. 이와 같이 추적이 실패되는 사건들이 많아지면 많아질수록 코호트 연구의 효과는 감소하게 된다. 따라서 연구대상자들과 정기적인 연락을 취하는 등의 노력을 통해 이러한 탈락(drop-out) 건수의 발생이 최소화되도록 해야 할 것이다.

 

 결과(outcome) 및 노출(exposure)에 관한 정보 

질병의 과에 대한 완전하고 정확한 정보를 얻는 것은 매우 중요하다. 예를 들어 사망이나 질병이 혹시 관심 위험요인이 아닌 다른 원인으로 인한 것은 아닌지 확인해야 하고, 또한 이를 위해서 질병력이나 사망통계, 입원기록 등을 조사할 필요가 있을 수도 있다. 연구기간 동안 관심 위험요인에 관한 노출여부가 변하기도 한다. 예를 들어 음주량과 심장질환 간의 관련성을 평가하고자 할 때, 개인의 음주량은 시간이 지남에 따라 변할 수도 있다는 점을 감안해야 한다. 따라서 연구가 진행되는 도중에 연구대상자들의 노출여부나 그 정도를 반복적으로 재조사하는 것도 중요하다. 

 

코호트 연구자료의 분석 

아래의 표는 코호트 연구의 관찰빈도를 표시한 것이다.

코호트 연구는 시간의 흐름에 따라 환자들을 추적조사하기 때문에 전체 표본을 사용해 모집단 내 질병 발생 위험 (risk)을 추정하는 것이 가능하다. 

모집단 내 관심요인에 노출된 사람들과 노출되지 않은 사람들의 질병 발생 위험 역시 각각 위와 동일한 방식으로 추정할 수 있다. 

따라서 노출되지 않은 집 단 대 비 노출된 집단의 질병 발생 상대위험 (relative risk, RR)은 다음과 같이 추정된다.

상대위험 (RR) 은 위험요인에 노출되면 질병 발생 위험이 몇 배나 증가(혹은 감소)하는지 에 대한 척도이다. 상대위험이 1이라는 것은 노출된 집단과 노출되지 않은 집단 간의 질병 발생 위험은 같다는 의미이다. 상대위험이 1보다 크면 위험요인에 노출된 집단의 질병 발생 위험이 노출되지 않은 집단에 비해 상대적으로 더 높다는 것을 의미하고, 상대위험이 1보다 작으면 요인에 노출되는 경우 질병발생 위험이 줄어든다는 의미이다. 예를 들어 상대위험이 2이면 위험요인에 노출된 집단의 질병 발생 위험은 노출되지 않은 집단보다 2배 더 높다는 의미이다. 

상대위험을 해석할 때에는 반드시 해당 질병의 기저위험 (underlying risk) 도 함께 고려해야 한다. 만일 기저위험이 매우 낮은 질병이라면 비록 상대위험이 상당히 크더라도 그 임상적/보건학적 중요도는 매우 낮을 것이다. 

항상 상대위험에 대한 신뢰구간도 계산해야 한다. 우리는 이 신뢰구간을 시용하여 혹은 검정통계량(test statistic)을 사용해, (모집단) 상대위험이 1이라는 귀무가설을 검정할 수 있다. 신뢰구간은 통계분석 소프트웨어를 사용하면 쉽게 계산할 수 있다.

 

 

'보건학 관련' 카테고리의 다른 글

통계학19(사례-대조군 연구1, Case-control studies)  (2) 2024.02.15
통계학18(코호트 연구2)  (1) 2024.02.12
통계학16(임상시험2)  (2) 2024.02.07
통계학15(임상시험1)  (3) 2024.02.03
통계학14(연구설계3)  (0) 2024.02.01