AI战升级：千亿大模型如何重塑网络安全未来？

置顶南阳

已于 2024-09-12 17:38:34 修改

阅读量1.2k

点赞数 29

分类专栏：科技资讯文章标签：人工智能网络 chatgpt

于 2024-09-12 17:31:45 首次发布

本文链接：https://blog.csdn.net/weixin_72847531/article/details/142181853

版权

科技资讯专栏收录该内容

20 篇文章 0 订阅

订阅专栏

在AI广泛应用的时代，网络安全面临着前所未有的挑战。

AI以黑客的身份学习了自动化攻击技术，并且成功率相当高。根据伊利诺伊大学香槟分校研究团队的最新研究，GPT-4在阅读CVE漏洞描述后能够快速学会利用漏洞进行攻击，成功率高达87%。

既然攻击者已经与时俱进，利用AI新技术进行破坏，防御方自然不会坐以待毙，正在积极将AI大模型纳入反制策略，最近发生了一件大事：

刚刚完成10亿融资的新生代网络安全领军企业长亭科技，与同为清华系的AI基础设施厂商趋境科技联手，发布了新一代安全大模型解决方案。此次合作将长亭问津（ChaitinAI）安全大模型的参数规模提升至超过千亿，全面提升了安全能力。

至此，网络安全行业正式迈入千亿大模型时代。

AI攻防战，千亿大模型带来的改变

从百亿到千亿，随着大模型参数规模的升级，究竟能为网络安全带来什么变化？

网络安全领域的两个核心指标是攻击识别准确率和检测时延。在企业的网络系统中，每天都有各种访问和调用请求，需要识别每一个请求是正常业务还是恶意攻击。引入大模型后，系统能够更快速、更准确地进行攻击判断。

举个例子，常见的欺诈邮件就是一种恶意攻击形式，一旦点击其中的链接或下载文件，计算机可能遭受攻击。引入大模型后，当用户收到邮件时，大模型能够即时对邮件内容进行分析，基于多条线索在多步骤中判断是否为恶意攻击。一旦确认是恶意邮件，系统会在数秒内自动向用户发出警告，提醒其不要点击链接或下载附件。

在长亭科技超过30万多类型攻击样本的测试中，某国内头部大模型的攻击识别率为48.3%。而通过长亭与趋境科技合作推出的千亿参数安全大模型方案，识别率提升至92.1%。

在另一项基于真实攻击流量构建的私有数据集的测试中，问津（ChaitinAI）也成功将识别率从65.5%提升至95.8%。

以对安全要求更高的金融企业为例，其交易行为和数据的安全性要求极高，网络环境复杂且每天产生大量日志数据。相应的攻击手段也十分多样。在一次网络异常事件中，问津（ChaitinAI）安全大模型迅速响应，从海量日志中提取相关数据行为并进行标准化处理，识别出这是一次APT攻击（高级持续性威胁）。模型提取了与攻击行为相关的关键资产，扫描出其中的安全漏洞，并明确了威胁来源。接着，模型对攻击流量、文件等进行了深入分析，成功识别出伪装成合法软件的恶意工具包。

问津（ChaitinAI）为此次攻击提供了精准的事件分析报告和处理对策，整个过程仅用时3分钟，平均检测时间（MTTD）和平均响应时间（MTTR）从原先的三十分钟至数小时缩短至不到10分钟，帮助企业安全团队快速定位和决策，成功阻止了APT攻击的进一步渗透和破坏。

这样的提升还不止于此，接下来在多个方面都能看到显著改进：

事件分析处理建议采纳率提升
安全报告内容生成质量得分提升
代码问题发现与检测的准确性提升
漏洞修复建议采纳率提高
违法、有害、暴力及色情等不良内容的识别能力增强
渗透测试中大模型驱动的漏洞发现与可利用数量增加
基于不同场景选择合适工具和策略的准确性提升
综合输出的稳健性和不同场景下的输出质量波动减少

Scaling Law的力量在垂直领域的大模型中再次得到验证：参数规模的提升不仅仅体现在单点指标上，而是全面提升了模型的通用性和泛化能力，带来了广泛的应用场景突破。

破解效果、效率和成本的不可能三角

过去，为什么安全行业没有采用千亿大模型？主要原因在于安全检测效果、用户响应效率和私有部署成本之间的矛盾。

安全行业对检测效果的要求极高，一个小小的安全漏洞就可能带来巨大的损失。千亿参数的安全大模型相比于百亿参数，在效果上进一步提升。

与此同时，网络安全防护是24小时不间断的任务，需要持续调用大模型进行推理。一旦检测到攻击事件，响应速度至关重要。

此外，安全行业对数据隐私性要求也非常高，通常需要在本地部署模型并用特定数据进行训练。而千亿参数模型的训练和维护需要巨大的计算资源，成本可能高达数百万。

在确保高效安全效果、降低部署成本和提升检测效率这三者之间，看似不可调和的三角关系，如今被长亭科技和趋境科技的合作成功破解。

AI Infra新秀入局：降低部署门槛

这是掌握垂直行业场景的公司与AI基础设施技术公司合作的典型案例。

长亭科技是国内顶尖的网络信息安全公司，专注于为企业级用户提供智能、简洁的安全防护产品和解决方案。而趋境科技是一家AI基础设施领域的新兴企业，致力于构建和开发大模型推理加速平台，提供高效、低成本的大语言模型推理服务。

趋境科技不久前联合清华KVCache.AI团队发布了开源项目KTransformers（https://github.com/kvcache-ai/ktransformers）。该项目通过利用MoE模型和长文本注意力算子的稀疏特性，采用异构划分策略，大幅提升了超大模型和超长文本的推理性能，显著降低了本地部署的门槛。使用KTransformers，仅需12GB显存和百余GB内存就能在本地运行千亿参数大模型，如Mixtral 8x22B和DeepSeek-Coder-V2，性能比Llama.cpp提升数倍。

该技术使得千亿参数大模型的本地使用成本降低了10倍以上。