从AndroidZoo获取良性和恶意APK样本

AndroZoo是一个不断扩展的Android样本库,目前已经包含超过1500万个样本,其中每个样本都做了标记,包括其创建时间,Virustotal识别为恶意软件的scanner数量等。
想从AndroZoo下载APK首先需要在其网站上申请API,建议使用.edu后缀的邮箱发送邮件获取个人API。然后下载latest.csv.gz文件,该文件解压后是一个.csv格式的表单,包含数据库中所有APK的信息(只获取该文件不需要API),用来对所需要的APK进行查找和筛选。

下载的方式有三种

  • 在Linux下使用Curl命令
  • 利用浏览器下载
  • 使用Androzoo脚本下载

前两种方式需要自己手动从latest.csv中找到想要APK的md5码,不适合大批量下载,因此介绍Androzoo脚本的使用。
讲github上的az项目clone到本地,在C:\Users%USERNAME% 路径下创建.az文件,文件中写入API和latest.csv文件路径(先解压得到csv文件),如下:

key=2072**************************************80d
input_file=E:\Project\Python\latest.csv

命令行中进入az项目路径下,运行python setup.py install命令,执行完后即可使用az命令从AndroZoo下载APK。

az的参数如下,大小,时间,vt检测从数目都可以设置成区间。

-n, --number INTEGER Number of apks to download.
-d, --dexdate TEXT The date on a dex file, format %Y-%m-%d, e.g. 2015-10-03.
-s, --apksize TEXT Apk size, in bytes.
-vt, --vtdetection TEXT Virus total rating, integer.
-pn, --pkgname TEXT Package names.
-m, --markets TEXT Markets, e.g. play.google.com. Possible values (can differ, since repository is updating): 1mobile,angeeks,anzhi,apk_bang,appchina,fdroid,freewarelovers,genome,hiapk,markets,mi.com,play.google.com,proandroid,slideme,torrents.
–sha256 TEXT SHA256 hashes.
–sha1 TEXT SHA1 hashes of apks to download.
–md5 TEXT MD5 hashes of apks to download.
-md, --metadata TEXT Metadata. This is a subset of latest.csv column names to keep in metadata.csv. By default sha256,pkg_name,apk_size,dex_date,markets.
-o, --out TEXT Output folder name. By default current directory.
-sd, --seed INTEGER Seed for a random algorithm.
-k, --key TEXT Androzoo api key.
-i, --input-file TEXT Path to input csv.
-t, --threads INTEGER Number of threads for concurrent download. 4 by default.
–version Show the version and exit.
–help Show this message and exit.

评论 31
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值