Text-to-SQL

2개의 포스트

Text-to-SQLMonte Carlo Tree Search

Alpha-SQL: 몬테카를로 트리 탐색을 이용한 Zero-Shot Text-to-SQL

Alpha-SQL은 파인튜닝 없이 LLM의 성능을 활용하는 새로운 Zero-shot Text-to-SQL 프레임워크입니다. 이 방법은 SQL 생성을 Monte Carlo Tree Search (MCTS)를 이용한 탐색 문제로 정의하여, 단계적으로 SQL 쿼리를 구성합니다. 핵심 기술로는 MCTS 과정에서 LLM을 동적으로 활용하여 SQL 구성 액션을 생성하는 LLM-as-Action-Model과, 생성된 후보 쿼리의 품질을 평가하는 self-supervised reward function이 있습니다. 이를 통해 Alpha-SQL은 별도의 파인튜닝 없이도 오픈소스 LLM의 Text-to-SQL 성능을 크게 향상시키며, 기존 SOTA 모델을 능가하는 정확도를 보여줍니다. 논문 제목: Alpha-SQL: Zero-Shot Text-to-SQL using Monte Carlo Tree Search

Text-to-SQLAgentic Framework

CHASE-SQL: Text-to-SQL을 위한 다중 경로 추론 및 후보 선택 최적화

CHASE-SQL은 Text-to-SQL 작업에서 Large Language Model (LLM)의 성능을 향상시키기 위한 새로운 프레임워크입니다. 이 프레임워크는 multi-agent 모델링을 활용하여 다양한 고품질 SQL 후보를 생성하고, 이 중 최적의 후보를 선택합니다. 후보 생성을 위해 (1) 복잡한 쿼리를 하위 쿼리로 분해하는 divide-and-conquer 방식, (2) 데이터베이스 엔진의 실행 단계를 모방하는 query execution plan 기반의 chain-of-thought (CoT) 추론, (3) 테스트 질문에 맞춤화된 few-shot 예시를 제공하는 instance-aware synthetic example generation 기법을 사용합니다. 생성된 후보들 중 최상의 쿼리를 선택하기 위해, fine-tuned된 selection agent가 pairwise 비교를 통해 후보들의 순위를 매깁니다. CHASE-SQL은 이 접근 방식을 통해 BIRD Text-to-SQL 벤치마크에서 SOTA 성능을 달성했습니다. 논문 제목: CHASE-SQL: Multi-Path Reasoning and Preference Optimized Candidate Selection in Text-to-SQL