머신러닝을 이용한 소아 근시진행 예측모델 개발
- Abstract
- 연구목적: 대량의 굴절검사 데이터를 이용하여 머신러닝 기법을 통해 소아에서의 근시 예측모델을 개발하고자 한다.
연구대상과 방법: 만 5세부터 19세 이하의 소아 중, 조절마비굴절검사를 1개월 이상의 간격으로 2회 이상 시행한 환자를 대상으로 하였다. 예측의 독립변수로는 성별, 첫 시행한 검사의 나이, 구면렌즈값, 원주렌즈값, 구면렌즈대응치, 마지막에 시행한 검사의 나이를 이용하였으며, 종속변수는 마지막에 시행한 검사의 구면렌즈대응치로 설정하였다. 머신러닝 회귀 기법 중 선형 모델은 단순 선형 회귀와 규제 회귀 중 릿지(Ridge), 라쏘(Lasso), 엘라스틱넷(ElasticNet)의 방법을 사용하였다. 비선형 회귀의 방법은 다차원 다항 함수 회귀에서 2차부터 7차 다항식을 이용하였고, 앙상블 회귀 방법에서는 랜덤 포레스트(Random Forest), 그래디언트 부스팅 머신(Gradient Boosting Machine; GBM), 익스트림 그래디언트 부스트(eXtreme Gradient Boost; XGB), 라이트 그래디언트 부스팅 머신(Light Gradient Boosting Machine; LGBM) 회귀 모델을 이용하였다. 총 9가지의 회귀 방법을 이용하였고, 훈련데이터와 검증데이터를 9:1 비율로 설정하여, 무작위 샘플링을 통하여 학습시키고 검증하는 과정을 10회 시행(교차검증)하였다. 예측모델의 정확도는 각 교차검증에서 확인된 10회의 평균제곱근오차(root mean squared error; RMSE)를 평균하여 비교하여 확인하였다.
연구결과: 전체 연구대상 데이터는 총 18,621건(조절마비굴절검사 37,242회)이었으며, 이 중 여자 환아는 9,666건(51.9%)였다. 평균 연령은 첫 시행한 검사에서 7.5 ± 2.0세(평균 ± 표준편차)였고, 마지막 시행한 검사에서 9.7 ± 2.3세였다. 조절마비굴절검사 결과 첫 검사에서의 구면렌즈대응치는 +0.70 ± 3.46 디옵터였으며, 마지막 검사에서는 -0.37 ± 3.84 디옵터였다. 첫 검사와 마지막 검사 사이의 평균 검사 간격은 2.2 ± 1.5년이었다. 회귀모델 교차검증에서 RMSE값은 단순 선형 회귀 모델에서 0.961이었고, 규제모델에서는 0.958 ~ 0.963의 분포를 보였으며, 다차원 다항함수 모델에서는 0.884 ~ 1.084의 분포를 보였다. 앙상블 회귀 모델에서는 RMSE값이 0.758 ~ 0.843의 범위를 보여 앙상블 회귀 모델의 예측력이 가장 좋았다. 앙상블 회귀 모델에서 회귀에 앞서 대상군을 분류할 때 중요하였던 변수는 첫 검사의 구면렌즈대응치와, 첫 검사 및 마지막 검사의 나이였다. 특히, 라이트 그래디언트 부스팅 머신(Light Gradient Boosting Machine; LGBM) 회귀 모델에서는 다른 앙상블 모델과 달리 첫 검사와 마지막 검사 나이가 더 중요한 변수로 이용되었다.
결론: 머신러닝을 이용하여 소아 근시진행 예측모델을 만들 수 있었다. 근시 진행 예측모델을 만들 때 첫 검사 나이와 구면렌즈대응치가 가장 중요한 요소로 추정된다.
- Author(s)
- 김대희
- Issued Date
- 2019
- Awarded Date
- 2020-02
- Type
- Dissertation
- Keyword
- 소아; 근시; 예측모델; 머신러닝; 회귀; 굴절이상
- URI
- https://oak.ulsan.ac.kr/handle/2021.oak/6674
http://ulsan.dcollection.net/common/orgView/200000285079
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.