用数据集训练算法识别恶意软件，就像识别猫一样简单

最新推荐文章于 2024-07-20 19:53:14 发布

人工智能观察

最新推荐文章于 2024-07-20 19:53:14 发布

阅读量2.7k

点赞数

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

本文由人工智能观察编译

译者：Sandy

从勒索软件到僵尸网络，恶意软件正在以各种各样的形式出现，而且还一直处于增长状态。虽然网络安全员一直在尽自己最大的努力来保证用户电脑的安全，但似乎还是躲不过恶意软件的袭击。因此，为了改变这个情况，他们将目光转向了人工智能。

然而，问题还是有的——机器学习工具需要大量的数据。对于像计算机视觉或者语言处理这样的任务来说，这还是可以接受的。因为在这个过程中，大型且开源的数据集可以用来教授算法，比如猫是什么样子的或者单词之间的关系。但是，在恶意软件方面，这些东西一直是空缺的，到现在也是如此。

不过，本周，网络安全公司Endgame发布了一款名为EMBER的大型开源数据集。EMBER是一个包含了100多万种良性和恶意Windows可移动执行的文件集合，这是一种常见的恶意软件隐藏格式。

该公司的一个团队还发布了可以在数据集上进行培训的人工智能软件。其想法很简单，如果想要人工智能成为打击恶意软件的强大武器，那么它就需要知道该寻找什么。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

其实，安全公司有大量的潜在数据用于算法的训练，但这是一个喜忧参半的结果。开发恶意软件的黑客会不断调整其代码，努力保持领先地位，因此，对过时的恶意软件样本进行培训，最后可能做的是无用功。

“这是一场打鼹鼠的游戏，”来自马里兰大学计算机科学的教授Charles Nicholas表示。

从本质上说，EMBER的目的是为了帮助自动化网络安全程序的展开。

与可以感染研究员计算机的实际文件集合相比，EMBER包含的是文件的“替身”，这是一种数字代表，为算法提供了与良性或恶意文件相关的特征概念，却不会暴露文件本身。

这应该可以帮助网络安全社区的人们快速训练和测试更多的算法，使他们能够构建更好的、适应性更强的狩猎恶意软件的AI。

当然，将数据集公开使用也意味着责任，如果这个数据集被黑客采用了呢？研究恶意软件的黑客便可以通过这些数据设计一个AI技术无法识别的病毒系统，一旦发生，情况会很糟糕。

对此，Endgame的数据科学技术总监Hyrum Anderson表示，该公司已对此问题进行了考虑。进行EMBER研究的Anderson称，他希望公开的好处会大于风险。此外，鉴于网络犯罪非常有利可图，开发恶意软件的黑客是很有动力来继续完善其攻击工具的。

最后，加州大学伯克利分校的计算机科学教授Gerald Friedland表示，“不管怎么样，黑客总能找到案例。”

640?wx_fmt=gif

人工智能观察

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

人工智能观察 CSDN认证博客专家 CSDN认证企业博客

码龄7年

117: 原创

-: 周排名

93万+: 总排名

42万+: 访问

: 等级

3703: 积分

68: 粉丝

33: 获赞

18: 评论

139: 收藏

私信

关注

热门文章

最新评论

不写代码也能玩转AI，uber最新开源项目了解一下？
CSDN-Ada助手: 百度的paddlepadle库做的不错，不知道是否用过呢？
背了单词再也不怕忘，多邻国的AI要逆天！
CSDN-Ada助手: 在平时的科研学习中，如何看论文？如何评价工作？如何找idea？
下一个特斯拉在哪里？
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性。
AI项目失败率高达50%！人工智能离企业级应用还有多远？
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录；(3)起一个更符合文章内容的标题。
谷歌AI模型ML-Jam激发音乐家创作，人机合作或成未来大势！
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录；(3)起一个更符合文章内容的标题。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。