Monte Carlo Tree Search

2개의 포스트

Controllable SummarizationMonte Carlo Tree Search

PACO: MCTS를 이용한 다중 속성 제어 요약의 적응형 계획

PACO는 다중 속성 제어 요약(multi-attribute controllable summarization)을 위한 훈련이 필요 없는(training-free) 프레임워크로, Monte Carlo Tree Search (MCTS)를 활용하여 여러 요약 속성을 순차적으로 제어하는 최적의 순서를 계획합니다. 기존 언어 모델들이 길이, 주제, 발췌율 등 상호 의존적인 여러 속성을 동시에 제어하는 데 어려움을 겪는 문제를 해결하기 위해, PACO는 요약을 점진적으로 수정하며 각 속성을 단계별로 조정합니다. 이 MCTS 기반 접근법을 통해, PACO는 속성 간의 충돌을 최소화하고 최적의 제어 경로를 적응적으로 탐색하여, 작은 모델로도 대형 모델에 필적하는 강력한 제어 성능을 달성합니다. 논문 제목: Adaptive Planning for Multi-Attribute Controllable Summarization with Monte Carlo Tree Search

Text-to-SQLMonte Carlo Tree Search

Alpha-SQL: 몬테카를로 트리 탐색을 이용한 Zero-Shot Text-to-SQL

Alpha-SQL은 파인튜닝 없이 LLM의 성능을 활용하는 새로운 Zero-shot Text-to-SQL 프레임워크입니다. 이 방법은 SQL 생성을 Monte Carlo Tree Search (MCTS)를 이용한 탐색 문제로 정의하여, 단계적으로 SQL 쿼리를 구성합니다. 핵심 기술로는 MCTS 과정에서 LLM을 동적으로 활용하여 SQL 구성 액션을 생성하는 LLM-as-Action-Model과, 생성된 후보 쿼리의 품질을 평가하는 self-supervised reward function이 있습니다. 이를 통해 Alpha-SQL은 별도의 파인튜닝 없이도 오픈소스 LLM의 Text-to-SQL 성능을 크게 향상시키며, 기존 SOTA 모델을 능가하는 정확도를 보여줍니다. 논문 제목: Alpha-SQL: Zero-Shot Text-to-SQL using Monte Carlo Tree Search