Survey of Hallucination in Natural Language Generation
자연어 생성(NLG) 모델이 유창하지만 사실과 다르거나 소스에 근거하지 않은 텍스트를 생성하는 할루시네이션(Hallucination) 현상은 주요 과제 중 하나입니다. 이 논문은 NLG 분야에서 발생하는 할루시네이션 문제에 대한 포괄적인 개요를 제공합니다. 할루시네이션의 정의와 분류, 발생 원인을 데이터와 모델 측면에서 분석하고, 이를 측정하기 위한 다양한 평가 지표(metrics)와 해결하기 위한 완화 방법(mitigation methods)을 체계적으로 정리합니다. 또한, 요약, 대화, 질의응답, 데이터-텍스트 변환, 기계 번역 등 주요 NLG 태스크별로 할루시네이션 연구 동향을 심도 있게 다룹니다. 논문 제목: Survey of Hallucination in Natural Language Generation