학문 분야의 융합을 통한 학제 간 연구가 확대되고 접근 가능한 전자저널의 수가 증가함에 따라, 연구자들이 논문을 투고할 적합한 학술지를 선택하는 것이 더욱 어려워지고 있다. 특히 학술출판 시스템별로 서비스하는 학술지가 상이하고 국내 학술단체에서 발행하는 국제 학술지들이 증가하는 현 학술 생태계를 반영한 학술지 추천 연구는 부족한 실정이다. 본 연구는 언어모델을 활용한 기계학습 기반의 학술지 추천 아키텍처를 제안한다. 제안된 아키텍처는 타겟 데이터에 대하여 추가 학습된 BERT 계열 언어모델을 통해 논문의 제목과 초록을 임베딩하고, 이 임베딩 벡터를 XGBoost 모델에 입력하여 학술지를 추천한다. 분석 결과, BERT 계열 언어모델 중 RoBERTa 모델이 가장 우수한 성능을 보였으며, 특히 RoBERTa 기반 추천 시스템의 정확도는 전통적인 자연어 처리 기법 기반 시스템보다 약 13% 이상 높게 나타났다. 학습된 모델을 활용하여 서비스 대상 학술지의 범위를 벗어난 논문과 국문으로 작성된 논문에 대한 추천의 유효성을 확인하였다. 본 연구는 국내 학술논문 데이터를 통해 언어모델과 기계학습을 결합한 학술지 추천 시스템의 활용 가능성을 보였다는 점에서 학술적으로, 실제 국내 학술출판 환경을 고려한 서비스 아키텍처를 제시했다는 점에서 실무적으로 의의가 있다.
As interdisciplinary research expands through the convergence of academic fields and the number of accessible electronic journals increases, researchers face growing challenges in selecting appropriate journals for manuscript submission. There is a lack of research on journal recommendation systems that reflect the Korean academic ecosystem, in which academic services offer different sets of journals and international journals published by Korean academic societies are increasing. This study proposes a machine learning-based journal recommendation architecture that leverages language models. The proposed architecture embeds paper titles and abstracts using BERT-based language models further trained on target data, and these embedded vectors are then input into an XGBoost classifier to recommend appropriate journals. Analysis results showed that among BERT-based models, RoBERTa demonstrated the best performance, with its recommendation system outperforming approximately 13% higher compared to systems based on traditional natural language processing techniques. Furthermore, it was found that recommendations for papers outside the scope of service journals and papers written in Korean were feasible. This study contributes both academically and practically by presenting an academic journal recommendation architecture that leverages language models and machine learning by considering the actual Korean academic publishing environment.
