논문리뷰 - Chain of Code: Reasoning witha Language Model-Augmented Code Emulator

카테고리 없음

논문리뷰 - Chain of Code: Reasoning witha Language Model-Augmented Code Emulator

Y00nseo 2023. 12. 26. 14:39

Chain of Code: Reasoning with a Language Model-Augmented Code Emulator

https://arxiv.org/pdf/2312.04474.pdf

Introduction

LM의 코드 기반 추론을 향상시키는 간단하고 효과적인 방식인 Chain of Code (CoC) 방법론을 제시. CoC의 핷심 아이디어는 LM이 추론 과정에서 semantic한 서브 테스크들을 유연한 의사 코드(pseudo code)로 형식화해 언어 모델은 코드로 생각하는 과정을 적용함으로써 더 다양한 추론 질문에 정확하게 답할 수 있게 된다.

언어 모델 추론 과정의 방법론 예시, (a) Direct answer only (b) Chain of thought (c) chain of code

Method

CoC방법론의 작동 과정은 다음과 같다.

1. (d) 질문을 해결하기 위해 pseudo code를 생성

2. (e) 각 줄의 코드 실행이 가능할 경우, 코드 인터프리터와 LMulator(언어 모델emulation code) 를 사용해 코드를 실행한다. 파란 하이라이트는 생성된 코드, 빨간 하이라이트는 코드의 실행, 보라 하이라이트는 LMulator가 녹색의 프로그램 상태를 통해 코드를 시뮬레이션하는 과정을 의미한다.