文件头、文件尾、特征码、常见文件的特征码

特征码

程序运行时,在内存中为完成特定的动作,要有特殊的指令,-一个程序在运行时,同一内存地址的指令是相同的同-一个程序中,一段连续的地址(它的指令相同),那么截取这段地址,就可以判断它是不是这个程序。为了防止出现病毒的误查杀,可以提取出多段特征码。这也就是我们所说的复合特征码.

分类

A.特征码主要又分为:文件特征码,内存特征码,行为特征码,(主动特征码,如瑞星)
B.同时,又分为:单一特征码和复合特征码;.
单一特征码:一个程序中的几句代码被杀毒软件做为识别标志。修改掉一处就可以免杀。
复合特征码:一个程序中的多句代码被杀毒软件作为识别标志。有--处不修改都不能免杀。


常见文件的特征码:

文件格式文件头文件尾
JPEG(jpg/jpe/jpeg)FF D8 FFFF D9
PNG(png)89 50 4E 47AE 42 60 82
gif47 49 46 3800 3B
ZIP50 4B 03 0450 4B
AVI41 56 49 20
xls/or/docD0 CF 11 E0
mdb53 74 61 6e 64 61 72 64 20 4a
wpdFF 57 50 43
RAR52 61 72 21
tif49 49 2A 00
psd38 42 50 53
xml3C 3F 78 6D 6C
HTML68 74 6D 6C 3E
PDF25 50 44 46 2D 31 2E
ICO00 00 01 00
MPG00 00 01 BA
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
文件特征提取是指从文件中提取出具有代表性的特征,通常用于文件分类、相似度比较、恶意软件检测等领域。常用的文件特征提取方法主要有以下几种: 1. 哈希值提取:将文件转换成哈希值,常用的哈希算法有MD5、SHA1等,哈希值可以作为文件的唯一标识符。 2. N-gram特征提取:将文件内容转换成N-gram序列,N-gram是指连续的N个字符或单词,可以用于文本分类、恶意软件检测等领域。 3. 图像特征提取:对于图像文件,可以使用局部特征描述符提取方法,如SIFT、SURF、ORB等,提取图像的局部特征。 4. 元数据提取:文件的元数据包括文件名、大小、创建时间、修改时间、作者、版本号等信息,这些信息可以作为文件特征。 下面是一个使用MD5哈希值提取文件特征的Python代示例: ```python import hashlib # 定义一个函数,用于计算文件的MD5哈希值 def get_file_md5(filename): with open(filename, 'rb') as f: md5_obj = hashlib.md5() while True: data = f.read(4096) if not data: break md5_obj.update(data) return md5_obj.hexdigest() # 调用函数,计算文件的哈希值 filename = 'example.txt' file_md5 = get_file_md5(filename) # 输出文件的哈希值 print(file_md5) ``` 在这个示例中,我们定义了一个`get_file_md5`函数,用于计算指定文件的MD5哈希值。然后,我们调用这个函数,传入要计算哈希值的文件名,获取文件的哈希值。最后,我们输出文件的哈希值。这个哈希值可以作为文件特征,用于文件的分类、相似度比较、恶意软件检测等领域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Moriia---

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值