Light

Dark

[Paper Review] Improving Configurability of Unit-level Continuous Fuzzing

An Industrial Case Study with SAP HANA

Jan 06, 2022 About 1 min

#study #paper #review

Improving Configurability of Unit-level Continuous Fuzzing : An Industrial Case Study with SAP HANA

논문 전문 : https://hongshin.github.io/pubs/ase21-industry.pdf

Summary

customized mutation operator들을 효율적으로 이용하기 위한 5개의 새로운 mutation scheduling strategies 제안
3개의 새로운 seed corpus selection strategies 제안
결과 : Fuzzing framework을 target component에 맞게 더 명확하게 configuration할 수 있도록 함으로써 Fuzzing의 성능 향상

IV. Configurability for Seed Corpus Selection

Motivation and Proposed Technique

Initial seed corpus : Fuzzing의 search scope를 결정하는 key factor.
어떤 컴포넌트에서 코드의 특정 부분에만 수정이 있을 때 (local change), Fuzzer가 해당 변화만 빠르게 체크하도록 하기를 원한다면? => General-purpose seed corpus 대신, 수정된 코드와 관련된(relevant) seed corpus를 사용하면 좋을 것이다.

Proposed Technique

Resulting corpus와 Coverage information을 함께 저장
바뀐 코드 부분을 커버하는 test input들의 subset을 모아 change-specific seed corpus를 만든다.

Overal Workflow of The Proposed Technique

General mode : general-purpose seed corpus 사용

General mode fuzzing이 끝나면 생성된 corpus가 corpus database로 전달됨. (* resulting corpus : 적어도 하나의 unique한 coverage item을 커버한 인풋들의 subset)
per-function seed corpus : 각 test input에 대해 실행된 function들을 idnetify => 해당 function을 커버하는 test input들의 set을 per-function seed corpus로 corpus database에 저장.

Local mode : Target component에 Local code change가 발생했을 때, 수정된 버전의 failure를 빠르게 체크하고자 할 경우 사용.

Change analysis module : 코드가 수정된 모든 function을 identify. (diff 사용)
Corpus selection module : 수정된 function들에 대한 정보와 per-function corpus를 사용해 수정된 function들을 테스팅하기 위한 corpus 생성. (corpus database를 업데이트하지는 않음. biased.)
- seed corpus size를 컨트롤하기 위한 3 strategies
  1. select-all
  2. select-coverage
  3. select-N

Evaluation

4개의 code change & bug 시나리오 + baseline (using general-purpose seed corpus)

코드 변화에 specific한 seed corpus를 사용하는 것이 fuzzing의 성능을 향상시킨다.
select-all이 가장 좋은 결과를 보였다.