ISSN : 1225-598X
이 연구는 리포지토리의 데이터 큐레이션 과정 중 데이터 품질 평가 및 선별 단계에 집중하여 기탁된 연구데이터에서 발견되는 문제점들을 분석하고 유형화하였다. 연구데이터의 가치 제고와 재이용 활성화를 위한 데이터 큐레이션의 중요성이 강조되고 있으나, 리포지토리의 큐레이션 작업에 대한 실증적 연구는 부족하다. 이 연구에서는 해외 리포지토리 가이드라인을 검토하여 품질 평가 유형 및 문항을 제시하고, 이를 바탕으로 한국사회과학자료원의 장기 미구축 데이터세트 166건을 분석하였다. 분석 결과, 데이터세트 완결성, 데이터 무결성, 파일 형식, 데이터 문서화, 법적․윤리적 문제 등 다섯 가지 유형 중 데이터세트 완결성과 법적․윤리적 문제가 가장 빈번하게 발생하면서도 리포지토리가 단독으로 해결하기 어려운 문제로 나타났다. 이 연구는 기탁된 데이터를 평가 및 선별할 때 식별되는 문제 유형을 구체적인 기준을 통해 분석하여 리포지토리의 데이터 큐레이션 과정을 이해하는 데 기여한다는 점에서 의의가 있다.
This study systematically analyzes and categorizes the challenges found in deposited research data by focusing on the appraisal and selection phases of the data curation process. While the importance of data curation for enhancing the value of research data and promoting data reuse has been emphasized, there has been a lack of empirical research on repositories’ data curation practices. This study reviews international repositories’ guidelines to identify quality assessment types and criteria and applies them to analyze 166 long-term non-archived datasets from Korea Social Science Data Archive (KOSSDA). The analysis reveals five types of challenges: dataset completeness, data integrity, file format, data documentation, and legal/ethical issues. Dataset completeness and legal/ethical issues are the most frequent and difficult challenges to resolve independently. This study contributes to a better understanding of the repositories’ data curation process by analyzing the challenges identified during data appraisal and selection phases through concrete criteria.
-검정.jpg)