站酷设计官方网站,江门众瞬网络科技有限公司,佛山市手机网站建设企业,立陶宛与俄罗斯最新消息本次分享论文为#xff1a;DeGPT: Optimizing Decompiler Output with LLM 基本信息
原文作者#xff1a;Peiwei Hu, Ruigang Liang, Kai Chen
作者单位#xff1a;中国科学院信息工程研究所#xff1b;中国科学院大学网络空间安全学院
关键词#xff1a;反向工程… 本次分享论文为DeGPT: Optimizing Decompiler Output with LLM 基本信息
原文作者Peiwei Hu, Ruigang Liang, Kai Chen
作者单位中国科学院信息工程研究所中国科学院大学网络空间安全学院
关键词反向工程大语言模型反编译器输出优化
原文链接
https://dx.doi.org/10.14722/ndss.2024.24401
开源代码
https://github.com/PeiweiHu/DeGPT 论文要点
论文简介此论文提出了DeGPT框架旨在通过大语言模型(LLM)优化反编译器输出改进其可读性与简洁性从而更好地辅助逆向工程师理解二进制文件。通过引入三角色机制裁判、顾问、操作员与微片段语义计算(MSSC)技术DeGPT在不改变原始函数语义的前提下显著提升了反编译器输出的分析效率和理解深度。
研究背景反向工程是理解和分析未知二进制文件如恶意软件的关键技术。反编译器作为反向工程中的重要工具能将低级汇编代码转换为高级程序语言代码。然而现有反编译器输出存在命名无意义、结构冗余、缺乏注释等问题降低了代码理解效率。
研究贡献
1.提出一个新的基于LLM的端到端优化框架通过重构语义信息和代码结构简化来提高反编译代码的可读性。
2.设计了一种三角色机制最大化利用LLM的潜力进行代码优化。
3.引入MSSC技术确保优化操作不改变原始代码的功能语义。 引言
DeGPT框架的核心思想是利用大语言模型的强大能力来优化反编译器的输出使其更加易于理解和分析。尽管反编译器已经能够将二进制代码转换为高级语言代码但由于缺乏有效的语义信息恢复能力如变量命名和注释添加这些输出往往难以被直接利用。DeGPT通过一种创新的三角色机制裁判R_ref、顾问R_adv、操作员R_ope和微片段语义计算(MSSC)方法旨在克服现有方法的局限性优化反编译输出的结构和语义信息提高逆向工程师对二进制文件的理解。 背景知识
反向工程是通过分析软件的二进制形式来理解其工作原理和逻辑结构的过程。反编译器是反向工程中不可或缺的工具它能够将低级别的汇编代码转换成更易于理解的高级程序语言代码。然而由于反编译过程中的语义信息丢失反编译器输出的代码往往缺乏有效的命名和注释使得逆向工程师难以快速理解代码的意图和结构。 论文方法
理论背景: DeGPT利用大语言模型(LLM)的强大能力来优化反编译输出通过增加语义信息和改进代码结构来提高代码的可读性和理解度。
方法实现: DeGPT采用三角色机制裁判、顾问、操作员来指导LLM进行优化操作确保优化过程不改变代码的原始功能语义。同时引入了微片段语义计算(MSSC)通过比较优化前后代码的功能行为确保优化操作不会引入语义误差。 实验
实验设置实验在多个数据集上进行包括实用命令行工具、恶意软件、音频处理库和算法实现等不同类型的软件。
实验结果DeGPT在不同数据集上显示出显著的优化效果包括降低认知负担24.4%以及在变量命名和注释添加方面的显著改进62.9%的注释能为逆向工程师提供实用的语义帮助。 论文结论
DeGPT框架成功地优化了反编译器输出通过改进代码的可读性和结构简洁性在不改变原始函数语义的前提下显著提高了逆向工程师分析二进制文件的效率和准确性。这项工作展示了大语言模型在软件逆向工程领域的巨大潜力和应用价值。 原作者论文解读智能体
润色Fancy
校对小椰风