바로가기메뉴

본문 바로가기 주메뉴 바로가기
 
 

logo

  • P-ISSN2466-2542
  • KCI

한국문학 분야 KORMARC 서지레코드를 활용한 저작 식별 개선 방안 연구

A Study on Improving Work Identification Using KORMARC Bibliographic Records in the Field of Korean Literature

한국도서관·정보학회지 / Journal of Korean Library and Information Science Society, (P)2466-2542;
2025, v.56 no.2, pp.109-132
https://doi.org/10.16981/kliss.56.2.202506.109
나상오(Sangoh Na) (경북대학교)
강우진(Woojin Kang) (경북대학교)
이종욱(Jongwook Lee) (경북대학교)

초록

본 연구는 국립중앙도서관에서 제공하는 한국문학 분야 KORMARC 서지레코드를 활용하여 저작 식별의 개선 방안을 제안하였다. 기존 연구에서는 서지개체를 식별할 때 레코드별 저작 세트 간 완전 일치를 기준으로 저작을 군집화하는 방식을 주로 사용하였다. 이러한 방식은 동일 저작이라도 표기 방식 등의 차이로 인해 서로 다른 저작으로 분리되는 문제가 발생하였다. 이 문제를 해결하기 위해 본 연구에서는 저자명과 표제를 추출하는 과정에서 한문-한글 변환, 서양인명의 성-이름 순서 변환, 저자 역할어 및 관제 제거 등의 전처리 과정을 수행하였다. 또한, 네트워크 분석 기법을 적용하여 저자명 및 표제를 기준으로 각각의 네트워크를 생성한 후, 네트워크 간 레코드 집합의 교집합을 식별하는 과정을 통해 저작을 식별하고 관련 레코드를 연결하였다. 연구 결과, 453,846건의 서지레코드에서 268,684개의 저작을 식별하였으며, 기존의 문자열 완전 일치 방식보다 더 정교한 저작 식별이 가능함을 확인하였다. 다만, 서지레코드의 입력 상태에 따라 저작 식별에 일부 한계가 나타났으며, 이를 보완하기 위한 후속 연구가 필요함을 알 수 있었다. 본 연구에서 제안한 방법은 저작 식별 과정을 개선함으로써 서지개체의 식별은 물론, 장기적으로는 서지레코드의 링크드데이터 변환에도 기여할 것으로 기대된다.

keywords
서지레코드, 저작 식별, 네트워크 분석, 한국문헌자동화목록형식

Abstract

This study proposes an improved method for identifying works using KORMARC bibliographic records in the field of Korean literature, provided by the National Library of Korea. Previous research primarily clustered works based on exact matches between bibliographic record sets. However, this approach often led to the separation of identical works due to differences in notation and other variations. To address this issue, this study applied preprocessing techniques that included Chinese character-to-Korean conversion, reordering of Western names (surname first, then given name), and the removal of author role terms and added titles when extracting author names and titles. Additionally, a network analysis technique was employed to construct separate networks based on author names and titles. The process of identifying the intersection of record sets across these networks was then used to identify works and link related records. As a result, 268,684 works were identified from 453,846 bibliographic records, demonstrating a more refined work identification process compared to exact string matching methods. Nevertheless, some limitations were observed in identifying works due to errors in some bibliographic record inputs, highlighting the need for further research to address these issues. The proposed method is expected to improve the work identification process, thereby improving bibliographic entity identification and, in the long term, contributing to the transformation of bibliographic records into linked data.

keywords
Bibliographic Record, Work Identification, Network Analysis, KORMARC
투고일Received
2025-02-28
게재확정일Accepted
2025-03-11
출판일Published
2025-06-30

한국도서관·정보학회지