代码生成摘要
该课题的当代进展,按照发展顺序排列:
uIR检索技术
该技术利用词性标注识别出最有可能体现代码特性的关键词;然后分析修正在词性标注过程中可能引入的错误;其次,对标识出的关键词进行降噪,以减少文本噪声带来的不利影响;最后,从关键词中选取若干个权值最高的词以组成代码摘要。但是面临着关键词抽取困难等弊端。
文献:Automatic
generation of natural language summaries for java
classes.
文献:Source
code summarization technology based on syntactic
analysis
引入代码克隆检测技术检测相似片段,提取相似片段的注释信息。
文献:Clocom:
Mining existing source code for automatic comment
generation.
u建立源代码的语言模型:
fault detection文献:On
the naturalness of buggy code
code completion文献:A
statistical semantic language model for source code
code summarization文献:Summarizing
source codeusing
a neural attention model.
u基于深度学习&结合Attention机制
lAttention机制的起源于计算机视觉
文献:Recurren