논문 번역 블로그
논문 번역 블로그
  • 블로그
  • 전체 글
  • 태그
  • 블로그
  • 블로그

    • 홈
    • 전체 글
    • 태그 목록
  • 인기 태그

    #Large Language Model#Video Moment Retrieval#Transformer#Video Retrieval#LLM#Language Model
    모든 태그 보기 →

Event Modeling

1개의 포스트

2025. 9. 17.
PRVREvent Modeling

UEM: 부분 관련 비디오 검색을 위한 불균일 이벤트 모델링

기존의 부분 관련 비디오 검색(PRVR)은 비디오를 고정된 길이의 클립으로 분할하여 이벤트 경계가 모호해지는 문제가 있었습니다. Uneven Event Modeling (UEM) 프레임워크는 이를 해결하기 위해 두 가지 핵심 모듈을 제안합니다. 첫째, Progressive-Grouped Video Segmentation (PGVS) 모듈은 프레임 간의 의미적 유사성과 시간적 연속성을 고려하여 가변적인 길이의 이벤트로 동적 분할을 수행합니다. 둘째, Context-Aware Event Refinement (CAER) 모듈은 주어진 텍스트 쿼리와의 cross-attention을 활용하여 이벤트 표현을 정제하고, 쿼리와 가장 관련성 높은 프레임에 집중하도록 합니다. 이 접근법은 보다 정확한 텍스트-비디오 정렬을 가능하게 하여 PRVR 벤치마크에서 SOTA 성능을 달성했습니다. 논문 제목: Uneven Event Modeling for Partially Relevant Video Retrieval

모든 태그 보기

© 2025 junhan.blog