FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented Generation

Zhiping Zhou; Xiaohong Li; Ruitao Feng; Yao Zhang; Yuekang Li; Wenbu Feng; Yunqian Wang; Yuqing Li

doi:10.48550/arxiv.2510.19615

Back

FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented Generation

Preprint

Open access

FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented Generation

Zhiping Zhou, Xiaohong Li, Ruitao Feng, Yao Zhang, Yuekang Li, Wenbu Feng, Yunqian Wang and Yuqing Li

arXiv (Cornell University)

Cornell University

22/10/2025

DOI: https://doi.org/10.48550/arxiv.2510.19615

Files and links (1)

url

FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented GenerationView

Preprint (Author's original)CC BY V4.0, Open

Metrics

1 Record Views

Abstract

Decompilation converts machine code into human-readable form, enabling analysis and debugging without source code. However, fidelity issues often degrade the readability and semantic accuracy of decompiled output. Existing methods, such as variable renaming or structural simplification, provide partial improvements but lack robust detection and correction, particularly for complex closed-source binaries. We present FidelityGPT, a framework that enhances decompiled code accuracy and readability by systematically detecting and correcting semantic distortions. FidelityGPT introduces distortion-aware prompt templates tailored to closed-source settings and integrates Retrieval-Augmented Generation (RAG) with a dynamic semantic intensity algorithm to locate distorted lines and retrieve semantically similar code from a database. A variable dependency algorithm further mitigates long-context limitations by analyzing redundant variables and integrating their dependencies into the prompt context. Evaluated on 620 function pairs from a binary similarity benchmark, FidelityGPT achieved an average detection accuracy of 89% and a precision of 83%. Compared to the state-of-the-art DeGPT (Fix Rate 83%, Corrected Fix Rate 37%), FidelityGPT attained 94% FR and 64% CFR, demonstrating significant gains in accuracy and readability. These results highlight its potential to advance LLM-based decompilation and reverse engineering.

Details

Title: FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented Generation
Creators: Zhiping Zhou - Tianjin University
Xiaohong Li - Tianjin University
Ruitao Feng - Southern Cross University
Yao Zhang - Tianjin University
Yuekang Li - University of New South Wales (Australia, Sydney)
Wenbu Feng - Tianjin University
Yunqian Wang - Tianjin University
Yuqing Li - Tianjin University
Publication Details: arXiv (Cornell University)
Publisher: Cornell University
Identifiers: 991013325410902368
Academic Unit: Faculty of Science and Engineering
Language: English
Resource Type: Preprint

FidelityGPT: Correcting Decompilation Distortions with Retrieval Augmented Generation

Files and links (1)

Metrics

Abstract

Related content

Details

Southern Cross University Social media