데이터 사이언스를 활용한 사회안전망 강화:

의료보장제도 가입자의 위험 예측 모형 구축

 

 

정우진

본 연구의 목표는 데이터 사이언스를 활용하여 공적의료보장제도 가입자의 위험률을 예측하는 모델을 구축하는 것이다. 이를 위해 먼저 본고는 데이터 사이언스적 접근의 개념과 최근 연구 추세를 살펴보았다. 다음으로는 이러한 논의를 적용하여 미국 공적의료보장제도 보험가입자의 입원율을 예측하는 모형을 구축하였다. 전통적 회귀모형, 일반 기계 학습모형, 딥러닝 모형을 포함한 6개의 모형을 비교했을 때, 딥러닝 모형들이 가장 재현율이 높았다. 특히 전방향 다중 신경망 모델은 사회 인구학적 정보를 통해 80%의 정확도로 환자의 재원 여부를 예측할 수 있었다. 결론에서는 모형의 예측력을 높일 수 있는 방안과 함께, 고위험 대상자에 대한 예방적 개입을 실시함에 있어 시사점을 논의하였다. 이러한 논의는 인공지능 기술을 이용하여 사회안전망을 강화하고 사회복지 재원이 위기 가정 및 개인에게 적절히 전달될 수 있도록 하기 위한 학술 및 정책 연구의 일환으로 기여할 수 있을 것이다.

 

주제어: 데이터 사이언스, 인공지능, 빅데이터, 사회안전망

 


    Using Data Science to Strengthen the Social Safety Net:
Predicting Risk for Medicare and Medicaid Insurers*


Woojin Jung

This paper explores how data science can be used to strengthen the social safety net. As one such approach, the paper develops a model to predict the likelihood of hospital admission for Medicare and Medicaid insurers in the U.S. The analysis draws from the health insurance claims data of 45,000 patients with 939 features, spanning eight quarters from 2014 and 2015. Six models are adopted to predict patients' hospital admissions in 2016, based on their sociodemographic and health-related characteristics. The paper presents the rationale, processes, and results of analysis from logistic regression, Decision Tree, Random Forest, Support Vector Machine, feed-forward Multi-layer Perceptron (MLP), Convolution Neural Network, and Recurrent Neural Network. The best performing model, evaluated against recall and precision scores, is the MPL. This simple deep learning model was correct about 80% of the time for patient admissions to hospital. Additionally, tree-based algorithms provide important features related to hospital admission, such as medical risk scores. As a policy implication, the paper discusses predictive risk modeling to provide preventive care for at-risk populations. The paper concludes by suggesting strategies for using the data science approach in the allocation of social welfare programs and services.

 

Key Words:Data science, Artificial intelligence, Big data, Social safety net