바로가기메뉴

본문 바로가기 주메뉴 바로가기
 
 

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073
  • KCI

머신러닝을 활용한 청소년 독서 예측: 주요 영향 요인 분석과 모델 비교

Predicting Youth Reading Behavior Using Machine Learning: Analysis of Key Factors and Model Comparison

정보관리학회지 / Journal of the Korean Society for Information Management, (P)1013-0799; (E)2586-2073
2025, v.42 no.1, pp.131-153
https://doi.org/10.3743/KOSIM.2025.42.1.131
신인수 (동국대학교 교육대학원)
박성재 (한성대학교 지식정보문화트랙)

초록

본 연구의 목적은 머신러닝 기법을 적용하여 중학생들의 독서 여부에 영향을 미치는 요인을 분석하고 최적의 기법을 찾는 것이다. 2018 한국아동․청소년패널 데이터의 독서시간 변수를 이용하여 주중 독서시간이 1시간 이상인 학생을 독서집단으로, 독서를 하지 않은 학생을 비독서집단으로 구분하고 머신러닝 기법으로 로지스틱 회귀, 의사결정나무, 랜덤 포레스트, adaptive LASSO, SVM, 그래디언트 부스팅, kNN을 적용하여 비교 분석하였다. 분석 결과, 랜덤 포레스트와 그레디언트 부스팅이 가장 높은 예측 정확도를 보였다. 앙상블 기법은 비선형적 패턴을 효과적으로 포착하여 독서 여부를 정교하게 분류함을 보여주었다. 부분의존성 도표를 통해 학업 열의, 친구 및 교사 관계, 스마트폰 의존, 자아존중감 등이 독서 결정에 중요한 변수임이 확인되었다. 학업 열의와 자아존중감이 높을수록 독서 확률이 상승하는 한편, 학업무기력과 스마트폰 의존은 독서를 저해하였다. 본 연구 결과는 독서 장려 정책에 필요한 요인을 구체적으로 제시한다는 점에서 의의가 있다. 특히, 학업 동기부여, 친구 및 교사 지원, 미디어 활용 교육 등을 연계한 다각적 접근의 필요성을 시사한다.

keywords
독서, 청소년, 머신러닝, 랜덤 포레스트, 그래디언트 부스팅, 한국아동․청소년패널조사

Abstract

The purpose of this study is to identify the factors influencing middle school students’ reading behavior by applying various machine learning methods and to determine which method yields the best performance. Using data from the 2018 Korean Child and Youth Panel Survey, students who read more than one hour per weekday were classified as the reading group, while those who did not read at all were classified as the non-reading group. Seven machine learning methods-logistic regression, decision tree, random forest, adaptive LASSO, SVM, gradient boosting, and kNN-were then applied for comparative analysis. The analysis shows that random forest and gradient boosting achieved the highest predictive accuracy, indicating that ensemble methods can effectively capture nonlinear patterns and distinguish reading behavior more precisely. According to the partial dependence plots, academic engagement, relationships with peers and teachers, smartphone dependence, and self-esteem were significant variables in determining whether students read. While stronger academic engagement and higher self-esteem increased the likelihood of reading, academic helplessness, and excessive smartphone use impeded it. This study is significant in that it provides detailed factors necessary for designing effective reading promotion policies. In particular, it underscores the need for a multifaceted approach that integrates academic motivation strategies, peer and teacher support, and media utilization education.

keywords
reading, youth, machine learning, random forest, gradient boosting, the Korean Child and Youth Panel Survey
투고일Received
2025-02-16
수정일Revised
2025-03-04
게재확정일Accepted
2025-03-04
출판일Published
2025-03-01

정보관리학회지