KLI

검색

Ulsan Univ. Repository Thesis General Graduate School Medical Engineering 1. Theses(Master)

심전도 분석을 위한 딥러닝 기반 다중 클래스 분류와 이상치 탐지: 데이터 불균형과 임상적 해석

Metadata Downloads

Alternative Title: Deep Learning-Based Multi-Class Classification and Anomaly detection for ECG analysis: Addressing Data Imbalance and Clinical interpretation

Abstract: 4차 산업혁명 발전에 따라, 최근 의료 데이터의 빅데이터 형성에 따른 다양한 연구들이 진행되고 있다. 특히, 의료영상분야에서 Magenetic Resonance Imgage(MRI), Computed Tomography(CT), Ultrasonud image등 영상 데이터를 활용하여 각종 질환을 빠르고 정확한 진단을 위 해 다양한 분석 방법의 연구가 진행되었다. 의료영상 데이터를 시작으로 Electrocardiogram(ECG), Photoplenthysmography(PPG) 등 시계열 데 이터를 활용한 연구들도 활발히 진행되고 있다. 최근에는 딥러닝(Deep learning) 기술의 적용에 따른 많은 발전이 이루 어지고 있다. 딥러닝 기술에는 대표적으로 형태적인 특징을 추출하는 Convolutional Neural Network(CNN) 와 시간적인 특징을 추출하는 Recurrent Neural Network(RNN) 이 있다. 다양한 신경망을 통해 학습 방법에 따라 분류, 생성과 같은 연구들이 진행되고 있다. 학습 방법에는 지도학습, 비지도학습이 있다. 지도학습은 학습을 진행 할 때 입력에 대한 정답을 알려주는 방식으로 학습을 진행하는 방법이고, 비지도 학습은 정답 을 알려주지 않고 데이터의 특징을 군집화하고 새로운 데이터에 대해서 결과를 예측하는 방법이다. 의료 인공지능의 기술이 발전됨에 따라 한계점이 존재하는데 대표적인 한계점으로 데이터 불균형과 임상적 해석에 따른 문제점있다. 먼저 데이터 불균형은 의료데이터에서 흔히 발생하는 현상이다. 실제 의료데이터에서 대부분은 정상인 데이터가 많고, 특정 질환이나 질병에 대한 데이터는 적 기 때문에 데이터의 불균형은 불가피한 현상이다. 이러한 데이터를 가지고 딥러닝 학습을 진행하게 되면, 데이터의 지배적인 클래스에 대해서 편중화 된 모델로 학습이 되고 이는 소수 클래스에 대한 예측 및 진단의 성능이 현저하게 떨어지게 된다. 다음으로 임상적 해석에 따른 문제점은 딥러닝 분석 방법에 대한 불확실성에서 발생한다. 딥러닝 모델의 알고리즘의 복잡 한 계산과정을 이해할 수 없기 때문에 흔히 “블랙박스” 라는 특징을 가지 고있고, 이로 인해 분석에 대한 임상적인 의미가 불분명하다. 따라서 본 연구는 위의 문제점을 해결하기 위해, 심전도 데이터를 가지고 딥러닝 분석을 진행하고, 분석에 따른 데이터 불균형을 해소하기 위해 4 가지 실험을 통해 성능을 비교하여 최적의 성능 및 방법을 찾고, 임상적 해석에 따른 문제점은 정상 심전도 데이터의 주요 세가지부분을 비지도 학습 방법을 사용하여 학습을 진행하고, 심방세동 심전도 데이터의 이상치 를 계산하여 실제 의료진의 진단 방법 메커니즘을 모방하여 딥러닝으로 임상적 해석을 진행하여 해결한다. 데이터불균형 파트에서는 실제 병원 데이터 7355명의 다중리드 심전도를 사용한다. 이 파트에서의 분류기는 레즈넷(Resnet) 모델을 사용하여 지도 학습 방법으로 학습을 진행하여 8가지의 질환을 분류한다. 임상적 해석파트에서는 PTB-XL 9042명, 중국 7199명의 정상과 심방세 동환자 단일리드 심전도를 사용한다. 이 파트에서는 정상 심전도의 Q파이 전(preQ), QRS복합체(QRS), S파 이후(PostS) 로 나누어 오토인코더 모델 을 사용하여 학습을 진행하고, 심방세동 환자의 심전도로 모델 평가를 진 행하여 정상 심전도와 심방세동 심전도의 이상치를 계산하여 정상과 심방 세동을 분류한다. 연구 결과는 데이터 불균형 파트에서는 정확도와 F1 점수로 모델평가를 진행하였다. 결과는 각각 0.96 으로 Focal 손실함수를 사용한 실험이 데 이터 불균형 환경에서 가장 좋은 성능 보였다. 임상적 해석 파트에서는 각 주요부분인 PreQ,QRS,PostS 각 모델에 대한 이상치 점수는 Mean Squared Error(MSE)로 계산을 진행했고, 심방세동 과 정상 환자의 분류는 각 그룹의 이상치점수를 가지고 정확도와 F1 점수 로 평가를 진행했다. 결과는 PreQ에서 정상과 심방세동 이상치점수 각각 0.00126, 0.0182로 가장 큰 차이를 보였고, 분류 결과도 F1 점수와 정확 도 각각 0.92로 가장 좋은 성능을 보였다.