大家好,我 消失了很久,现在又来了。最近在研究代码挖掘的那些事。代码挖掘源于文本挖掘,在网上搜索了很久,除了找到几篇论文外(基本上属于理论引用性质,没有见到什么实际成果),还没有做实践研究的案例。于是,利用八小时外,以Linux Kernel源代码为挖掘对象,进行了代码挖掘研究工作。到目前为止,进展还算顺利,做了一个小网站(http://www.icodemining.com)。
这个网站实现了以下功能:代码的富文本显示、LOC的水平柱状图、提取代码的要素,诸如全局变量、宏定义、结构、函数、halstead、函数调用关系等。网站还在优化中,希望能坚持下去,并做大做强。