恶意代码种类:木马、蠕虫、广告软件、后门、间谍软件等;
恶意代码反检测技术
1)对抗反汇编技术:将具有特殊构造的数据和代码应用到程序中,错误的程序代码就会在使用反汇编分析工具进行分析时产生;
2)反调试技术:发现调试器被用来检测恶意代码的动作时,反调试技术被恶意代码编写者用来增加调试器对恶意代码的分析时间;延长调试的时间和调试复杂性,恶意代码一旦发现被调试,就通过修改自身程序来使自己奔溃或者修改已经设定的执行路径来达到阻碍调试器分析的目的;
3)反虚拟机技术:恶意代码里含有反虚拟机技术主要由于用于捕获恶意代码的蜜罐使用虚拟机,并且恶意代码攻击的目标通常是用户机器,而这些机器通常不可能运行在虚拟机中;
4)加壳与脱壳技术:加壳器—打包程序;对反病毒软件、复杂的恶意代码进行细致的分析从而达到隐藏恶意代码存在的目的,还可以对恶意代码可执行文件的大小进行缩减;
标准化方法
数据的标准化—将数据按比例缩放,将其选定在一个固定的区间中,数据的标准化处理—将数据统一映射到区间[0,1]区间中;1)atan函数转换(反正切函数)—数据都应该大于等于0,小于0的数据将被映射到[-1,0]区间上;2)z-score标准化—SPSS软件工具最为常用的,Z标准化也叫标准差标准化,处理后的数据符合标准正态分布,即均值为0,标准差为1;
特征提取与特征选择效果一样,区别在于:特征提取主要是通过特征之间的关系,组合原来的特征得到新的特征;特征选择是通过初始的特征子集中选择具有代表性的特征;