Language ModelQuantitative Reasoning
Minerva: 언어 모델을 활용한 정량적 추론 문제 해결
Minerva는 수학, 과학, 공학 분야의 정량적 추론 문제 해결에 특화된 대규모 언어 모델입니다. 일반 자연어 데이터로 사전 학습된 PaLM 모델을 기반으로, arXiv 논문 및 수학 콘텐츠가 포함된 웹페이지로 구성된 기술 데이터셋으로 추가 학습되었습니다. 이 모델은 외부 도구 없이도 단계별 풀이 과정을 생성하며, MATH, GSM8k와 같은 기술 벤치마크에서 최고 수준의 성능을 달성했습니다. Minerva는 자연어 설명과 정확한 LaTeX 수식을 혼합하여 복잡한 문제의 해답을 제시하는 능력을 보여줍니다. 논문 제목: Solving Quantitative Reasoning Problems with Language Models