AI战升级:千亿大模型如何重塑网络安全未来?

在AI广泛应用的时代,网络安全面临着前所未有的挑战。

AI以黑客的身份学习了自动化攻击技术,并且成功率相当高。根据伊利诺伊大学香槟分校研究团队的最新研究,GPT-4在阅读CVE漏洞描述后能够快速学会利用漏洞进行攻击,成功率高达87%。

既然攻击者已经与时俱进,利用AI新技术进行破坏,防御方自然不会坐以待毙,正在积极将AI大模型纳入反制策略,最近发生了一件大事:

刚刚完成10亿融资的新生代网络安全领军企业长亭科技,与同为清华系的AI基础设施厂商趋境科技联手,发布了新一代安全大模型解决方案。此次合作将长亭问津(ChaitinAI)安全大模型的参数规模提升至超过千亿,全面提升了安全能力。

至此,网络安全行业正式迈入千亿大模型时代。

图片

AI攻防战,千亿大模型带来的改变

从百亿到千亿,随着大模型参数规模的升级,究竟能为网络安全带来什么变化?

网络安全领域的两个核心指标是攻击识别准确率和检测时延。在企业的网络系统中,每天都有各种访问和调用请求,需要识别每一个请求是正常业务还是恶意攻击。引入大模型后,系统能够更快速、更准确地进行攻击判断。

举个例子,常见的欺诈邮件就是一种恶意攻击形式,一旦点击其中的链接或下载文件,计算机可能遭受攻击。引入大模型后,当用户收到邮件时,大模型能够即时对邮件内容进行分析,基于多条线索在多步骤中判断是否为恶意攻击。一旦确认是恶意邮件,系统会在数秒内自动向用户发出警告,提醒其不要点击链接或下载附件。

在长亭科技超过30万多类型攻击样本的测试中,某国内头部大模型的攻击识别率为48.3%。而通过长亭与趋境科技合作推出的千亿参数安全大模型方案,识别率提升至92.1%

在另一项基于真实攻击流量构建的私有数据集的测试中,问津(ChaitinAI)也成功将识别率从65.5%提升至95.8%

以对安全要求更高的金融企业为例,其交易行为和数据的安全性要求极高,网络环境复杂且每天产生大量日志数据。相应的攻击手段也十分多样。在一次网络异常事件中,问津(ChaitinAI)安全大模型迅速响应,从海量日志中提取相关数据行为并进行标准化处理,识别出这是一次APT攻击(高级持续性威胁)。模型提取了与攻击行为相关的关键资产,扫描出其中的安全漏洞,并明确了威胁来源。接着,模型对攻击流量、文件等进行了深入分析,成功识别出伪装成合法软件的恶意工具包。

问津(ChaitinAI)为此次攻击提供了精准的事件分析报告和处理对策,整个过程仅用时3分钟,平均检测时间(MTTD)和平均响应时间(MTTR)从原先的三十分钟至数小时缩短至不到10分钟,帮助企业安全团队快速定位和决策,成功阻止了APT攻击的进一步渗透和破坏。

这样的提升还不止于此,接下来在多个方面都能看到显著改进:

  • 事件分析处理建议采纳率提升

  • 安全报告内容生成质量得分提升

  • 代码问题发现与检测的准确性提升

  • 漏洞修复建议采纳率提高

  • 违法、有害、暴力及色情等不良内容的识别能力增强

  • 渗透测试中大模型驱动的漏洞发现与可利用数量增加

  • 基于不同场景选择合适工具和策略的准确性提升

  • 综合输出的稳健性和不同场景下的输出质量波动减少

Scaling Law的力量在垂直领域的大模型中再次得到验证:参数规模的提升不仅仅体现在单点指标上,而是全面提升了模型的通用性和泛化能力,带来了广泛的应用场景突破。

破解效果、效率和成本的不可能三角

过去,为什么安全行业没有采用千亿大模型?主要原因在于安全检测效果、用户响应效率和私有部署成本之间的矛盾。

图片

安全行业对检测效果的要求极高,一个小小的安全漏洞就可能带来巨大的损失。千亿参数的安全大模型相比于百亿参数,在效果上进一步提升。

与此同时,网络安全防护是24小时不间断的任务,需要持续调用大模型进行推理。一旦检测到攻击事件,响应速度至关重要。

此外,安全行业对数据隐私性要求也非常高,通常需要在本地部署模型并用特定数据进行训练。而千亿参数模型的训练和维护需要巨大的计算资源,成本可能高达数百万。

图片

在确保高效安全效果、降低部署成本和提升检测效率这三者之间,看似不可调和的三角关系,如今被长亭科技和趋境科技的合作成功破解。

AI Infra新秀入局:降低部署门槛

这是掌握垂直行业场景的公司与AI基础设施技术公司合作的典型案例。

长亭科技是国内顶尖的网络信息安全公司,专注于为企业级用户提供智能、简洁的安全防护产品和解决方案。而趋境科技是一家AI基础设施领域的新兴企业,致力于构建和开发大模型推理加速平台,提供高效、低成本的大语言模型推理服务。

趋境科技不久前联合清华KVCache.AI团队发布了开源项目KTransformers(https://github.com/kvcache-ai/ktransformers)。该项目通过利用MoE模型和长文本注意力算子的稀疏特性,采用异构划分策略,大幅提升了超大模型和超长文本的推理性能,显著降低了本地部署的门槛。使用KTransformers,仅需12GB显存和百余GB内存就能在本地运行千亿参数大模型,如Mixtral 8x22B和DeepSeek-Coder-V2,性能比Llama.cpp提升数倍。

该技术使得千亿参数大模型的本地使用成本降低了10倍以上。

图片

尤其在安全场景中,对于长文本推理的优化效果显著,即使面对1M长度的上下文,KTransformers也能在仅配备24GB显存的设备上运行,生成速度高达16.91 token/s,比Llama.cpp快10倍以上,同时维持接近满分的精确度。

图片

项目开源后,迅速吸引了Hugging Face等平台的关注,并在国内外社区引发了广泛讨论。

图片

大模型落地:千行百业的必经之路

随着AI基础设施日益完善,大模型安全需求日渐增多,长亭科技也迅速注意到了趋境科技的技术优势。

图片

由于问津(ChaitinAI)安全大模型同样具备参数和注意力的稀疏性,与趋境科技的技术战略高度契合,双方迅速展开合作,采用KTransformers的技术对问津(ChaitinAI)安全大模型进行升级,问津(ChaitinAI)安全千亿大模型方案因此应运而生。

图片

双方的合作不仅是对技术实力的验证,也是对行业场景落地能力和解决方案交付能力的体现。

大模型的快速落地离不开行业场景公司与AI基础设施公司的密切合作。未来,随着AI技术的不断发展和行业需求的增加,更多这样的合作将会涌现,不仅推动技术层面的创新,也将在安全、伦理、治理等多个维度展开探索,推动大模型在千行百业中的深度应用。

问津(ChaitinAI)千亿大模型解决方案试用链接:https://jsj.top/f/lzjQag

问津官网:https://www.chaitin.cn/zh/chaitinAI

KTransformers 开源链接:https://github.com/kvcache-ai/ktransformers

趋境科技官网:https://approaching-ai.com/

 

国内直接使用ChatGPT4o:

谷歌浏览器直接使用:https://www.nezhasoft.cn

  1. 无需魔法,同时支持手机、电脑

  2. 个人独享

  3. ChatGPT4o mini永久免费

  4. 支持Copilot、DALLE AI绘画、上传文件等

长按识别下方二维码,备注:南阳,发给你

图片

图片

图片

图片

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值