Skip Navigation
Skip to contents

W-ENTian W-ENTian

통계 이야기: 관찰 연구 수서서울이비인후과 최효근

최효근 엠디에널리틱스 대표는 서울대학교 의과대학 학사/석사/박사를 졸업하고, 서울대병원에서 이비인후과 전공의, 전임의를 수료한 뒤 한림대학교에서 10년간 빅데이터에 대한 연구를 하여, 총 307편의 SCI 논문을 주저자로 작성을 하였습니다. 엠디에널리틱스는 각종 빅데이터에 대한 자료 분석 및 연구의 통계 방법, 대상자 수 분석, 리뷰어의 통계 질문에 대한 답변 같은 통계 자문 서비스를 제공하고 있습니다. 본 연구자는 이전에 웹진에 4회에 걸쳐 투고하였던 통계 이야기에 대한 후속편 4회를 연재하려고 합니다.

관찰연구

논문을 작성하기 위해 연구를 진행할 때 서로 다른 두 집단을 비교하는 경우가 주로 많다. 특정 질병에 걸린 사람과 걸리지 않은 사람, 백신을 맞은 사람과 맞지 않은 사람 등 차이가 있는 집단을 비교해서 질병에 어떤 특성이 있는지, 백신이 어떤 영향을 주는지 등을 알 수 있다. 그러나 연구를 위해 인위적으로 건강한 집단에 바이러스를 투여하거나 특정 집단에만 백신을 투여하기에는 연구 대상자를 찾기 어렵거나 윤리적인 문제가 있을 수 있다. 이러한 문제점을 보완하기 위해 사용되는 연구가 관찰연구다. 연구자가 의도적으로 개입하지 않고 이미 질병에 걸린 사람, 이미 백신을 맞은 사람들을 두고 관찰하며 연구를 진행한다.

Follow-Up Study

만약 코로나가 치매에 미치는 영향을 파악하고 싶다면 우리는 코로나 양성 반응을 보였던 사람과 한번도 걸리지 않은 사람들을 모집하고, 그 사람들을 Follow-up하며 각 집단들의 치매 발생률을 확인하여 차이를 볼 것이다. 질병이 발생할 때까지 기다려야 하므로 연구는 짧게는 몇 년에서 길게는 몇 십 년까지 걸릴 수 있다. 긴 시간 동안 연구 대상자가 다른 병에 걸려 사망하거나 코로나 음성 반응이던 사람이 양성이 될 수도 있고(이를 중도탈락 되었다(Censored)고 한다), 심지어 연구 진행자가 사망하거나 연구비의 부족으로 연구가 중단될 수도 있다. 이런 단점을 가진 연구를 전향적 코호트 연구(Prospective Cohort Study)라고 하는데 이를 보완하기 위해 후향적 코호트 연구(Retrospective Cohort Study)가 나오게 되었다.

후향적 코호트 연구를 진행하는 방법은 약간의 시간적 차이가 있을 뿐 전향적 코호트 연구와 동일하다. 코로나가 아니라 20년 전 발생한 사스와 치매의 인과관계를 파악하려고 한다면 과거에 사스 양성 반응을 보였던 사람과 걸리지 않은 사람들이 기록된 자료를 활용한다. 그들을 현재부터 과거까지 Follow-up하여 연구하고자 하는 질병이 발생했는지 아닌지를 조사하여 연구를 진행한다. 코로나에 대한 연구를 진행하려고 하면 현재에 시작하는 것이 아니라 10~20년 뒤에 시작하면 된다. (물론 현재에 코로나 양성과 음성에 대한 기록이 확실하다는 조건이 있다.)

코호트 연구에는 Kaplan-Meier 생존분석이나 Cox Proportional Hazards Model을 사용한다. Kaplan-Meier 생존분석은 사건이 발생할 때마다 구간생존율을 구하여 누적 생존율을 추정하는 방식으로 환자군과 대조군의 그래프를 그려 생존율이 50% 이하로 떨어지는 시점을 추정할 수 있다. 생존율이 다를 경우 그래프의 기울기가 차이를 보여 두 군의 차이를 확인할 수 있다. 그러나 Kaplan-Meier는 독립변수가 하나인 경우에만 사용이 가능해서 여러 요인들의 영향을 알기 힘들다. 이를 해결하기 위해 주로 Cox Proportional Hazards Model을 사용한다. 예를 들어, 코로나에 대한 노출 여부 외에도 나이, 성별, 음주 여부 등 치매에 영향을 줄 수 있는 변수들을 포함시킨 후 환자군과 대조군의 위험률을 나누어 구하는 Hazard Ratio로 각 변수들이 미치는 위험을 아는 것이다.

Case-Control Study

질병의 발생률이 낮다면 적절한 분석을 할 만큼 발생자의 수가 충분하지 않아 코호트 연구를 진행하기 어려울 수 있다. 이를 극복하기 위해 질병에 걸린 환자군과 질병에 걸리지 않은 대조군으로 나누어 과거 특정 요인에 노출되었는지 여부를 조사하는 환자-대조군 연구(Case-Control Study)를 사용한다. 이 연구 방법은 코호트 연구에 비해 시간과 비용을 절약할 수 있지만, 과거의 사건에 대하여 진단, 처방에 의존하여 자료를 얻기 때문에 정보의 질이 상대적으로 코호트 연구보다는 떨어진다는 단점이 있다.

Nested Study

이러한 코호트 연구와 환자-대조군 연구의 단점들을 보완하기 위해 두 가지 연구를 섞은 혼합 연구 방법을 사용한다. 집단을 선정한 후 이들을 대상으로 면담과 소변이나 혈액 검사 등으로 여러 기본 정보들을 얻은 뒤 Follow-up하여 관찰하고 지속적으로 기록한다. 그 후 파악하고 싶은 질병이 생기면 해당 질병이 발생한 사람들을 환자군으로, 질병이 발생하지 않은 사람들을 대조군으로 나누어 기록된 자료를 통해 연구를 진행하는 방식이다. 대조군을 선정하는 방법에 따라 코호트 내 환자-대조군 연구(Nested Case-Control Study)와 환자-코호트 연구(Case-Cohort Study)로 나뉜다.

먼저 Nested Case-Control 연구는 각 환자가 발생한 시점에 동일한 비율의 대조군을 매칭하여 환자군과 대조군의 Follow-up 기간이 같다. (주로, 환자 1명이 발생할 때마다 4명의 대조군을 뽑는다) 그러나 대조군으로 선정된 후에도 질병이 발생할 가능성이 있어 두 군에 중복으로 뽑힐 가능성이 있다는 단점이 있다. 이러한 단점을 보완하기 위해 Case-Cohort 연구를 이용한다. 환자가 발생한 시점과 동일한 시점이 아니라 무작위로 선정한 집단 안에서 대조군을 선정하기 때문에 Follow-up 기간이 모두 다르며, 환자군과 같은 비율로 매칭되지 않기 때문에 한 질병 뿐만 아니라 여러 질병의 영향의 연구에 대해서도 적절하다는 장점이 있다.

Nested Case-Control 연구와 같이 환자군과 대조군이 1:1, 1:4 등 동일한 비율로 매칭 되어있는 경우에는 편향을 줄일 수 있게 조건부 로지스틱 회귀분석(Conditional Logistic Regression Analysis)을 사용하고, Case-Cohort 연구처럼 동일한 비율의 매칭이 아닌 경우 일반 로지스틱 회귀분석을 사용한다. 교차비(Odds Ratio)를 구하여 위험 요인이 증가할 때 질병에 끼치는 영향을 알 수 있다.

댓글쓰기
(04385) 서울특별시 용산구 서빙고로 67, 파크타워 103동 307호 (용산동5가 24)

Copyright © by Korean Society of Otorhinolaryngology-Head and Neck Surgery. All rights reserved.