Dataset BiasComputer Vision
데이터셋 편향과의 10년간의 전쟁: 우리는 아직 멀었는가?
10년 전 제안되었던 "데이터셋 분류" 실험을 최신 대규모 데이터셋과 발전된 neural network 아키텍처 환경에서 재검토합니다. 놀랍게도, 현대의 neural network는 이미지가 어떤 데이터셋에서 왔는지 매우 높은 정확도로 분류할 수 있음을 발견했습니다(예: YFCC, CC, DataComp 3-way 분류에서 84.7% 정확도). 이러한 데이터셋 분류기는 단순 암기를 넘어서 일반화 및 전이 가능한 semantic feature를 학습할 수 있으며, 이는 데이터셋 편향 문제가 여전히 심각함을 시사합니다. 논문 제목: A Decade's Battle on Dataset Bias: Are We There Yet?