바로가기메뉴

본문 바로가기 주메뉴 바로가기
 
 

logo

  • P-ISSN1229-2435
  • E-ISSN2799-4767
  • KCI

사용자 생성 콘텐츠(UGC) 플랫폼에서 건강 정보 신뢰도 이해: 신뢰도 요인과 사전 지식의 영향

Understanding Health Information Credibility across UGC Platforms: Varying Influences of Credibility Features and Prior Knowledge

한국비블리아학회지 / Journal Of Korean Biblia Society for Library and Information Science, (P)1229-2435; (E)2799-4767
2025, v.36 no.2, pp.183-209
https://doi.org/10.14699/kbiblia.2025.36.2.183
김희준(Heejun Kim) (북텍사스 주립대)
최보금(Bogeum Choi) (노스캐롤라이나 주립대)
알구엘로하이메(Jaime Arguello) (노스캐롤라이나 주립대)

초록

온라인 건강 정보의 신뢰성을 평가하는 일은 사용자 생성 콘텐츠(UGC)의 양이 증가함에 따라 점점 더 복잡해지고 있다. 본 연구는 두 가지 유형의 UGC 플랫폼인 Yahoo! Answers와 Yelp를 대상으로, 신뢰성 예측 모델링을 수행하고 다양한 범주의 특성(feature)과 평가자의 사전 지식이 미치는 영향을 분석하였다. 신뢰성 평가 도구와 엄격하게 검증된 자격 요건을 적용하고, 크라우드소싱을 통해 총 2,000개의 신뢰성 라벨을 수집하였다. 정교화 가능성 모델(Elaboration Likelihood Model, ELM)에 기반하여 84개의 특성을 개발하고 이를 범주로 구분하였으며, 두 데이터셋에 대해 각각 독립적으로 특성 제거(feature ablation) 실험을 수행하였다. 연구 결과, Yahoo! Answers에서는 콘텐츠 정보성(content informativeness)이 가장 영향력 있는 요인으로 나타났으며, Yelp에서는 감정(sentiment)과 콘텐츠 정보성이 모두 중요한 요인이었다. 흥미롭게도, 평가자의 사전 지식은 플랫폼에 따라 상반된 효과를 보였다. Yahoo! Answers에서는 과신과 제한된 분야 전문성으로 인해 모델 성능이 저하된 반면, Yelp에서는 주관적인 콘텐츠와 일치된 생활 경험의 효과로 인해 성능이 향상되었다. 이러한 결과는 신뢰성 평가와 특성 선택이 플랫폼의 유형과 콘텐츠의 성격에 맞게 조정될 필요가 있음을 시사한다.

keywords
신뢰성, 건강정보, 사용자 생성 콘텐츠, 사전지식, 기계학습

Abstract

Assessing the credibility of online health information has become increasingly complex as the volume of user-generated content (UGC) increases. This study investigates the predictive modeling of credibility in two distinct types of UGC platforms—Yahoo! Answers and Yelp—by exploring the impact of feature categories and the role of assessors’ prior knowledge. A total of 2,000 labeled instances were collected through crowdsourcing, using a rigorously validated credibility instrument and qualification process. Eighty-four features were developed and grouped into categories informed by the Elaboration Likelihood Model (ELM), and feature ablation studies were conducted independently on both datasets. Results indicate that content informativeness was the most discriminative factor for Yahoo! Answers, while sentiment and content informativeness were significant for Yelp. Interestingly, prior knowledge had a platform-dependent effect: it reduced model performance in Yahoo! Answers, likely due to overconfidence and limited domain expertise, but improved performance in Yelp, where lived experience aligned with subjective content. These findings emphasize the importance of tailoring credibility assessments and feature sets to the type of platform and the nature of the content.

keywords
Credibility, Health Information, User-Generated Content, Prior Knowledge, Machine Learning
투고일Received
2025-05-23
수정일Revised
2025-05-23
게재확정일Accepted
2025-06-05
출판일Published
2025-06-30

한국비블리아학회지