ISSN : 1229-2435
본 연구는 구술자료의 기록화 과정의 전 영역에 AI 기술을 적용하여 구술기록화의 효율성과 품질을 제고하기 위한 지능화 방안을 제시한다. 구술기록은 비정형 데이터로 구성되어 구조화와 검색이 어려운 특성을 지니며, 이에 따라 전사와 검수, 내용 분석 등 주요 절차가 수작업에 의존해왔다. 본 연구는 이러한 한계를 극복하기 위해 음성인식(STT: Speech-to-Text)기술과 거대언어모델(LLM: Large Language Model)을 결합한 통합형 지능화 프로세스를 설계하였다. 구체적으로, 용어사전 기반 키워드 부스팅을 통해 지역 고유명사의 인식률을 향상시키고, LLM을 활용하여 문장부호와 오인식 단어를 자동 교정함으로써 전사문의 일관성과 정확성을 확보하였다. 또한 생성형 AI를 활용하여 핵심 키워드․개체명․요약문을 자동 추출하고, 구조화하여 구술기록 간 의미적 연계를 구현하였다. 실제 진행된 마을기록사업에서 생산된 구술기록을 대상으로 적용한 결과, 전사 및 분석 과정의 자동화 효율성이 향상되었으며, 구술 내용에 대한 맥락적 이해 또한 보다 정교하게 이루어지는 것으로 확인되었다. 본 연구는 구술기록 관리의 패러다임을 기존의 ‘정리 및 기술’ 중심에서 ‘지능형 활용 중심’으로 전환할 수 있음을 보여주며, 향후 지능형 구술아카이브 구축을 위한 기초적 연구로서 학문적․실무적 의의를 지닌다.
This study proposes an intelligent framework that applies AI technologies throughout the entire process of collecting, managing, and utilizing oral history materials to enhance the efficiency and quality of oral documentation. Oral records consist of unstructured data, making them difficult to organize and search, and key procedures—such as transcription, verification, and content analysis—have therefore relied heavily on manual labor. To overcome these limitations, this study designs an integrated intelligent process that combines Speech-to-Text (STT) technology with Large Language Models (LLMs). Specifically, keyword boosting based on a domain-specific glossary was used to improve recognition accuracy for local proper nouns, and LLM-based automatic correction of punctuation and misrecognized words ensured consistency and accuracy in transcripts. In addition, generative AI was employed to automatically extract key terms, named entities, and summaries, and to structure this information to enable semantic linkages across oral records. Applying this model to oral history materials produced in an actual community documentation project demonstrated improvements in the automation efficiency of transcription and analysis, as well as more refined contextual understanding of oral content. This study shows that the paradigm of oral record management can shift from traditional manual “description” workflows to an “intelligent utilization-centered” model and provides foundational academic and practical insights for building intelligent oral archives in the future.
