역학 시간의존 공변량 역학 연구에서 우리가 흔히 다루는 데이터는 정적인 자료가 아니다 시간이 흐름에 따라 위험도와 관련 요인들이 변화하는 경우가 많다 단순히 한 시점에서 측정된 공변량만으로 현실을 설명하기 어려운 이유다 이럴 때 등장하는 개념이 바로 시간의존 공변량(time‑dependent covariates) 이다 시간의존 공변량은 말 그대로 시간이 지나면서 값이 변하는 변수로
개인의 행동, 환경 노출, 치료 상태 등이 시간이 흐르면서 달라지는 것을 반영한다 실제로 이를 무시하고 분석하면 인과추론의 정확도가 크게 떨어질 수 있다 따라서 시간의존 공변량은 생존분석, 특히 콕스 비례위험모형과 함께 중요하게 고려되어야 할 분석 요소다
역학 시간의존 공변량 대다수 역학 연구는 정적인 공변량(static covariates)을 가정하고 분석을 한다 예를 들어 나이, 성별, 인종, 초기 진단 상태 등은 한 시점에 고정된 변수로 다루기 적합하다 하지만 현실은 그렇지 않다 사람의 건강 상태, 운동량, 약물 복용 여부, 환경 노출 수준 등은 시간이 지나면 달라진다 예를 들어 약물 복용 여부가 시간이 지남에 따라 달라질 수 있다
초기에 복용하지 않던 사람이 중간에 복용을 시작할 수 있고 반대로 복용을 중단할 수도 있다 이러한 변화는 단순히 초기값만 가지고 분석했을 때 사건의 위험도 추정에 왜곡을 가져올 수 있다 시간의존 공변량을 적절히 반영하지 않으면 위험비(hazard ratio) 추정이 편향되거나 비례위험 가정 자체가 깨질 수 있다
| 정의 | 한 시점에서 측정된 변수 | 시간이 흐르며 값이 변하는 변수 |
| 예시 | 성별, 유전형 | 약물 복용, 혈압, 체중 |
| 분석 영향 | 단순 비교 | 동적인 위험 변화 반영 필요 |
역학 시간의존 공변량 시간의존 공변량은 단순히 시간이 흐르면서 변하는 모든 변수를 의미하지만 실제 연구에서는 몇 가지 대표적인 유형으로 나누어 생각할 수 있다 첫째, 내부 시간의존 공변량(internal time‑dependent covariates) 이는 결과 사건과 직접적으로 상호작용하는 변수를 말한다 예를 들어 심부전 환자의 혈압 변화, 암 환자의 종양 크기 변화 등이 해당된다 둘째, 외부 시간의존 공변량(external time‑dependent covariates) 이는 결과 사건과 독립적으로 시간이 흐르면서 변하는 변수다
예를 들어 계절적 대기오염 수준, 정책 시행 시점 등이 해당된다 또한 누적 시간의존 공변량(cumulative exposure)도 있다
이 경우 일정 기간 동안의 누적 값이 위험에 영향을 미친다 예를 들어 흡연 기간 누적량이나 평균 혈당값 누적 등이 이에 해당된다
| 내부 시간의존 | 개인 단위 변화 | 혈압, 체중 |
| 외부 시간의존 | 환경적 요인 변화 | 미세먼지 농도, 계절 |
| 누적 시간의존 | 누적 효과 반영 | 누적 흡연량, 누적 음주량 |
역학 시간의존 공변량 시간의존 공변량을 고려하기 위한 대표적인 통계 모델은 역시 콕스 비례위험모형(Cox Proportional Hazards Model)이다 콕스 모형은 기본적으로 다음과 같은 구조를 가진다.
h(t | X(t)) = h₀(t) × exp(β₁X₁(t) + β₂X₂(t) + …)
여기서 X(t)는 시간에 따라 달라지는 공변량을 의미한다 즉 콕스 모형에서 시간의존 공변량을 포함하면 해당 시점까지의 위험도 변화를 반영할 수 있다 이때 중요한 점은 시간의존 공변량이 들어갔다고 해서 비례위험 가정 자체가 사라지는 것은 아니지만 해석과 모형 설정은 더 복잡해진다
| `h(t | X(t))` |
| h₀(t) | 시간에 대한 기초 위험 |
| X(t) | 시간이 변하는 공변량 |
여기서 구체적인 예를 들어 보자 현상의 예시: 당뇨병 환자의 사망 위험에 미치는 혈당 변화 영향 분석
연구 대상자들은 초기 혈당값은 같지만 치료 중에는 치료 반응에 따라 혈당값이 올라가거나 내려간다 따라서 단순히 초기 혈당값만을 고정 공변량으로 분석할 경우 치료 경과에서 발생한 실제 위험에 대한 정보를 놓치게 된다
이럴 때 시간의존 공변량인 혈당값 변화를 포함하면 다음과 같이 위험도 추정이 가능하다.
| 001 | 0 | 180 | 0 |
| 001 | 3 | 160 | 0 |
| 001 | 6 | 150 | 1 |
| 002 | 0 | 190 | 0 |
| 002 | 3 | 200 | 0 |
| … | … | … | … |
위와 같은 데이터를 사용하면 혈당이 낮아질 때와 높아질 때의 위험도를 시간의존 공변량으로 추정할 수 있으며
이로 인해 치료 효과와 사건 위험 간의 관계를 더 정확히 파악할 수 있다
시간의존 공변량을 포함한 생존분석을 수행할 때 다음과 같은 전략과 고려사항이 필요하다
| 데이터 구조 | long format 필요 |
| 시점 정의 | 타당한 시간 간격 설정 |
| 비례위험 가정 | 추가 검토 및 검정 필요 |
시간의존 공변량 포함 모델의 해석은 고정 공변량 모델보다 약간 복잡하지만 기본적인 방향성은 같다
예를 들어 혈당값이 시간의존 공변량으로 포함된 경우 β 값이 양수라면 시간이 지남에 따라 혈당값이 커질수록 사건의 위험도가 증가함을 시사한다 중요한 점은 해석은 특정 시점의 위험비(Hazard Ratio)를 의미한다
즉, 한 단위 공변량 변화가 해당 시점에서의 위험도에 미치는 영향을 말한다
| β 양수 | 위험도 증가 |
| β 음수 | 위험도 감소 |
| exp(β) | 위험비 추정 |
시간의존 공변량을 다룰 때 교란변수(confounder) 문제는 더욱 까다로워진다 공변량이 시간이 흐름에 따라 변화할 뿐 아니라 그 변화 자체가 다른 요인에 의해 영향을 받을 수 있기 때문이다 이런 경우에는 단순히 시간의존 공변량만을 넣는 것으로는 부족하다
다음과 같은 조치가 유용하다
| 항암치료 변화가 체중에 영향 | 치료 자체가 공변량에 영향 |
| 운동량 변화가 스트레스에 영향 | 상호작용 고려 필요 |
| 정책 시행이 공변량 변화 유발 | 외부 요인 반영 필요 |
역학 시간의존 공변량 시간의존 공변량은 그 자체가 현실의 복잡한 사건과 위험을 시간의 흐름에 따라 반영하는 강력한 도구다
단순 고정 공변량만을 다루는 분석으로는 동적인 현실을 충분히 설명할 수 없으며 그 결과는 편향되거나 오해를 불러일으킬 수 있다
시간의존 공변량을 제대로 적용하기 위해서는 적절한 데이터 구조, 비례위험 가정의 검토, 교란변수와의 상호작용 분석,
그리고 측정 간격과 누락 시점 처리를 포함한 정교한 전략이 필요하다 현실은 변화 그 자체가 의미를 갖는다 시간의존 공변량을 이해하고 활용할 수 있다면 우리는 단순한 정적 분석을 넘어 현실의 동적인 흐름 속에서 진짜 위험을 정확하게 읽어낼 수 있게 된다
이제 당신의 데이터가 시간의 흐름 속에서 무엇을 말하는지 좀 더 선명하게 들릴 것이다