
경희대학교병원 내분비내과 상현지 교수와 임상의학연구소 연동건 교수팀이 머신러닝 기법을 활용해 향후 5년 이내 제2형 당뇨병 발병을 예측할 수 있는 모델을 개발하고 이를 세계적 국제학술지 「란셋(The Lancet)」 자매지인
연구팀은 2002년부터 2013년까지 약 12년 간 국민건강보험공단 건강검진에 참여한 약 97만 명의 데이터를 기반으로 5년 이상 추적관찰을 진행했다. 이중 당뇨병 병력이 있거나 사망 등으로 연구에 부적합한 사례를 제외한 약 39만 명의 데이터를 활용해 머신러닝 기반 예측 모델을 개발하고 내부 검증을 수행했다.
로지스틱 회귀(Logistic Regression)와 어댑티브 부스팅(AdaBoost) 기법이 조합된 앙상블 구조의 예측 모델은 총 18개의 건강검진 데이터를 학습 변수로 활용했다. 그중 ▲연령 ▲공복혈당 ▲헤모글로빈 ▲감마글루타밀전이효소(GGT) ▲체질량지수(BMI) 등이 제2형 당뇨병 발병과 유의한 상관관계를 보였으며, 모델은 72.6%의 높은 예측 정확도를 나타냈다.
특히, 일본 JMDC(1,200만 명) 및 영국 UK Biobank(41만 명)의 데이터를 활용한 외부 검증에서도 높은 예측 정확도를 보이며 해당 모델의 국제적 적용 가능성과 신뢰성을 입증했다.
상현지 교수는 “기존 예측 모델 연구는 전자의무기록(EHR) 데이터 혹은 단일 국가에 한정되어 일반화에 많은 한계가 있었다”며 “이번 연구는 실제 건강검진 데이터를 기반으로 한 다국적 대규모 코호트를 활용해 예측 모델의 신뢰성과 확장성을 입증한 것에 의미가 있다”고 말했다.
덧붙여 “해당 모델이 예측한 당뇨병 발생 확률이 가장 높은 상위 1/3 구간의 고위험군 사망위험은 발생 확률이 50% 미만인 저위험군에 비해 한국은 약 7.7배, 일본은 약 3.3배, 영국은 약 1.7배까지 증가하는 것으로 분석된 바, 당뇨병 조기 예측 및 예방의 중요성을 확인했다”고 말했다.
경희대학교 디지털헬스센터 홈페이지에는 이번 연구 결과를 기반으로 누구나 쉽게 당뇨병 발병 위험을 확인할 수 있는 웹사이트가 공개되어 있다.
댓글0