Improving Automated Program Repair using Code Coverage Analysis

Posted Jul 15, 2024

By 전형준

4 min read

I. 연구 개요

이 프로젝트는 CodeT5 모델과 코드 커버리지(Code Coverage) 분석을 결합하여 C++ 프로그램의 논리적 오류를 효과적으로 수정하는 방법을 제안합니다. 기존 APR 연구가 문법 오류에 집중한 반면, 본 연구는 테스트 케이스 실행 결과와 코드 실행 흐름 분석을 통해 논리 오류를 찾아내고 수정하는 데 초점을 맞추었습니다.

II. 연구 배경

논리 오류는 컴파일러가 탐지하지 못해 테스트 케이스 실행 결과를 통해서만 발견 가능.
스펙트럼 기반 오류 위치 추정(SBFL)은 성공/실패 테스트 케이스의 실행 라인 데이터를 비교해 오류 가능성이 높은 라인을 찾는 전통적 기법.
본 연구는 SBFL을 딥러닝 기반 APR과 결합하여 모델의 오류 위치 인식 능력을 강화.

III. 데이터셋 구축 과정

데이터 출처: Google DeepMind의 CodeContests 데이터셋 (정답 코드, 오답 코드, 테스트 케이스 포함)
데이터 페어링: Edit Distance ≤ 9 조건으로 논리 오류 중심 데이터 생성
코드 포맷팅: Clang-format으로 데이터 페어링의 노이지를 최소화
커버리지 수집:
- gcov로 성공/실패 테스트 케이스별 실행 라인 수집
- 실행 라인과 인접 라인에 가중치를 부여하여 의심 라인 추출
학습 입력 구성: 추출한 의심 라인 번호를 코드 첫 줄에 주석 형태로 삽입

IV. 모델 구조 및 실험

Baseline: 잘못된 코드 입력 → 수정 코드 생성 (CodeT5)
w/ GT Line: 실제 오류 라인 번호 제공
w/ Predicted Line: 커버리지 분석 기반 의심 라인 번호 제공
평가 지표:
- Perfect Repair: 모든 테스트 케이스 통과
- Partial Repair: 일부 테스트 케이스 성능 향상
- Perfect Localization: 예측 라인과 실제 오류 라인이 완벽 일치
- Partial Localization: 예측 라인 범위에 실제 오류 포함

V. 주요 실험 결과

Clang-format 적용만으로도 오류 위치 추정 및 수정 성능 향상
Predicted Line 제공 시:
- Clang-format 적용 → 성능 크게 향상
- 미적용 → 향상 폭 제한적
GT Line 제공 시:
- 오류 수정 및 위치 추정 정확도가 압도적으로 향상
- 정확한 오류 위치 정보의 중요성 입증

VI. 결론

코드 커버리지 기반 오류 위치 추정은 APR의 성능을 높이는 핵심 요소
코드 포맷팅 + 커버리지 분석 조합이 모델의 오류 수정 능력을 크게 개선
향후 정교한 커버리지 기반 위치 추정 알고리즘을 통해 APR 성능을 더욱 강화 가능

3D Reconstruction Tool Final Report

3D Reconstruction Tool Final Report

Project

Project APR Automated Program Repair KCC

This post is licensed under CC BY 4.0 by the author.

Trending Tags

LLM Paper Presentation Project CV RL CS231n Generative Model RNN

Contents

Further Reading

Expanded Spectrum‑Based Fault Localization for Automated Program Repair

Expanded SBFL 기반 LLM 자동 프로그램 수정 KCC 2025 Project 이번 프로젝트 “Expanded SBFL 기반 LLM 자동 프로그램 수정” 은 Python 논리 오류를 더 정밀하게 찾아내어 Large Language Model(LLM)의 자동 프로그램 수정(Auto Program Repair, APR) 성능을 높이는 것을 목표...

Satellite Image Multi‑label Classification

1) 프로젝트 개요 대회 베이스라인을 넘기 위해 전처리별 성능 차이에 집중한 멀티라벨 분류 프로젝트입니다. 한 장의 위성 이미지에서 최대 60개 라벨을 동시에 예측하며, 제출 포맷은 각 라벨의 확률값입니다. 데이터 크기: train 65,496 / test 43,665 라벨 수: 60 (예: trees, pavement, buildings,...

Comparative Analysis of Machine Learning Models for Molecular Toxicity Prediction

Tox21 독성 예측 프로젝트 — 타깃별 이진 분류 실험 기록 I. 프로젝트 개요 이번 겨울 방학 동안 진행한 화학물질 독성 예측 프로젝트입니다. 데이터는 Tox21 공개 데이터셋을 사용했고, multi-label 구조이지만 실제 학습은 각 타깃별 독립적인 이진 분류로 진행했습니다. 즉, 하나의 화합물에 대해 12개 타깃 각각의 독성 여부를 0(비독...

Trending Tags

LLM Paper Presentation Project CV RL CS231n Generative Model RNN

A new version of content is available.