바로가기메뉴

본문 바로가기 주메뉴 바로가기
 
 

logo

  • P-ISSN1225-598X
  • E-ISSN2982-6292

STEM 분야의 연구 소프트웨어 분석 - 소프트웨어 공유, 인용, 유형의 관점에서 -

Analyzing STEM Research Software from the Perspectives of Software Sharing, Citation and Types

한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292
2026, v.60 no.1, pp.373-397
https://doi.org/10.4275/KSLIS.2026.60.1.373
박형주(Hyoungjoo Park) (충남대학교)
김서원(Seowon Kim) (충남대학교 문헌정보학과)
김효은(Hyoeun Kim) (충남대학교)
최우성(Wooseong Choi) (충남대학교)

초록

본 연구의 목적은 STEM(Science, Technology, Engineering, Mathematics) 분야의 리포지토리에서 확인되는 연구 소프트웨어의 공유, 인용, 공유별 인용, 저자, 고유 식별자 및 소프트웨어 유형의 현황을 분석하는 것이다. STEM의 개별 학문 분야와 STEM 분야 전체를 종합하여 살펴보았다. 분석된 STEM 분야는 천체물리학, 생명과학, 컴퓨팅, 지구과학, 수학, 기술이었다. 본 연구는 전세계 453개의 리포지토리에서 색인 및 추적되는 Data Citation Index(DCI)에 저장된 565,000개 이상의 연구 소프트웨어를 분석의 대상으로 하였다. 대부분의 STEM 분야는 소프트웨어 유형을 단순히 ‘software’로만 명시하고 있었으며, 이 경우 인용 역시 높았다. 예외적으로 컴퓨팅 분야와 기술 분야는 소프트웨어 유형을 상세히 명시하고 있었다. 컴퓨팅 분야는 다양한 소프트웨어 유형이 비교적 균등하게 인용을 받고 있었으나, 기술 분야는 단순히 ‘software’로 명시한 경우가 대부분의 인용을 받고 있었다. STEM 분야는 소프트웨어 유형을 명시하지 않고 비워 두는 경우도 있었다. STEM 분야에서 소프트웨어의 공유가 주로 이루어지는 상위 2위 리포지토리는 CRAN, Figshare였으나, 소프트웨어 인용이 높은 상위 2위 리포지토리는 CRAN, Bioconductor였다. 연구 소프트웨어는 필수 메타데이터를 대부분 제공하고 있었으나, 저자명과 출판년도 등의 매우 중요한 메타데이터가 누락된 경우도 있었다. 대부분의 소프트웨어는 기관 저자가 아닌 개별 연구자가 공동저자로 명시되어 있었다. 본 연구의 공헌은 전세계 453개의 리포지토리에서 색인되는 STEM 분야의 연구 소프트웨어의 공유 및 공식적인 인용 현황을 개별 STEM 학문 분야와 이를 종합하여 상세히 살펴보았다는 점이다.

keywords
연구 소프트웨어, 연구데이터, Data Citation Index, STEM 분야

Abstract

The purpose of this study is to examine the current status of research software identified in STEM (Science, Technology, Engineering, Mathematics) repositories, specifically focusing on sharing, citations, citations based on sharing, authors, unique identifiers, and software types. This study examines both individual disciplines and the STEM field as a whole. The specific disciplines analyzed include astrophysics, biological sciences, computing, earth sciences, mathematics, and technology. The analysis was conducted on over 565,000 research software records indexed in the Data Citation Index (DCI), which indexes and tracks data from 453 repositories worldwide. The findings reveal that most STEM disciplines designate software types simply as “software,” and these records tended to have high citation rates. Exceptionally, the fields of computing and technology provided more detailed specifications for software types. In the computing field, various software types received citations relatively evenly; however, in the technology field, those simply labeled as “software” accounted for the majority of citations. In some instances across STEM fields, the software type was left blank. Regarding distribution, CRAN and Figshare were identified as the top two repositories for software sharing in STEM, whereas CRAN and Bioconductor emerged as the top two repositories for software citations. While most research software provided essential metadata, some critical information—such as author name and publication year—was occasionally missing. The majority of software listed individual researchers as co-authors rather than institutional authors. The contribution of this study lies in its comprehensive and detailed examination of the formal practices of research software across more than 453 global repositories, offering insights into both specific academic disciplines and the STEM field at large.

keywords
Research Software, Research Data, Data Citation Index, STEM Fields

한국문헌정보학회지