在AI广泛应用的时代,网络安全面临着前所未有的挑战。
AI以黑客的身份学习了自动化攻击技术,并且成功率相当高。根据伊利诺伊大学香槟分校研究团队的最新研究,GPT-4在阅读CVE漏洞描述后能够快速学会利用漏洞进行攻击,成功率高达87%。
既然攻击者已经与时俱进,利用AI新技术进行破坏,防御方自然不会坐以待毙,正在积极将AI大模型纳入反制策略,最近发生了一件大事:
刚刚完成10亿融资的新生代网络安全领军企业长亭科技,与同为清华系的AI基础设施厂商趋境科技联手,发布了新一代安全大模型解决方案。此次合作将长亭问津(ChaitinAI)安全大模型的参数规模提升至超过千亿,全面提升了安全能力。
至此,网络安全行业正式迈入千亿大模型时代。
AI攻防战,千亿大模型带来的改变
从百亿到千亿,随着大模型参数规模的升级,究竟能为网络安全带来什么变化?
网络安全领域的两个核心指标是攻击识别准确率和检测时延。在企业的网络系统中,每天都有各种访问和调用请求,需要识别每一个请求是正常业务还是恶意攻击。引入大模型后,系统能够更快速、更准确地进行攻击判断。
举个例子,常见的欺诈邮件就是一种恶意攻击形式,一旦点击其中的链接或下载文件,计算机可能遭受攻击。引入大模型后,当用户收到邮件时,大模型能够即时对邮件内容进行分析,基于多条线索在多步骤中判断是否为恶意攻击。一旦确认是恶意邮件,系统会在数秒内自动向用户发出警告,提醒其不要点击链接或下载附件。
在长亭科技超过30万多类型攻击样本的测试中,某国内头部大模型的攻击识别率为48.3%。而通过长亭与趋境科技合作推出的千亿参数安全大模型方案,识别率提升至92.1%。
在另一项基于真实攻击流量构建的私有数据集的测试中,问津(ChaitinAI)也成功将识别率从65.5%提升至95.8%。
以对安全要求更高的金融企业为例,其交易行为和数据的安全性要求极高,网络环境复杂且每天产生大量日志数据。相应的攻击手段也十分多样。在一次网络异常事件中,问津(ChaitinAI)安全大模型迅速响应,从海量日志中提取相关数据行为并进行标准化处理,识别出这是一次APT攻击(高级持续性威胁)。模型提取了与攻击行为相关的关键资产,扫描出其中的安全漏洞,并明确了威胁来源。接着,模型对攻击流量、文件等进行了深入分析,成功识别出伪装成合法软件的恶意工具包。
问津(ChaitinAI)为此次攻击提供了精准的事件分析报告和处理对策,整个过程仅用时3分钟,平均检测时间(MTTD)和平均响应时间(MTTR)从原先的三十分钟至数小时缩短至不到10分钟,帮助企业安全团队快速定位和决策,成功阻止了APT攻击的进一步渗透和破坏。
这样的提升还不止于此,接下来在多个方面都能看到显著改进:
-
事件分析处理建议采纳率提升
-
安全报告内容生成质量得分提升
-
代码问题发现与检测的准确性提升
-
漏洞修复建议采纳率提高
-
违法、有害、暴力及色情等不良内容的识别能力增强
-
渗透测试中大模型驱动的漏洞发现与可利用数量增加
-
基于不同场景选择合适工具和策略的准确性提升
-
综合输出的稳健性和不同场景下的输出质量波动减少
Scaling Law的力量在垂直领域的大模型中再次得到验证:参数规模的提升不仅仅体现在单点指标上,而是全面提升了模型的通用性和泛化能力,带来了广泛的应用场景突破。
破解效果、效率和成本的不可能三角
过去,为什么安全行业没有采用千亿大模型?主要原因在于安全检测效果、用户响应效率和私有部署成本之间的矛盾。
安全行业对检测效果的要求极高,一个小小的安全漏洞就可能带来巨大的损失。千亿参数的安全大模型相比于百亿参数,在效果上进一步提升。
与此同时,网络安全防护是24小时不间断的任务,需要持续调用大模型进行推理。一旦检测到攻击事件,响应速度至关重要。
此外,安全行业对数据隐私性要求也非常高,通常需要在本地部署模型并用特定数据进行训练。而千亿参数模型的训练和维护需要巨大的计算资源,成本可能高达数百万。
在确保高效安全效果、降低部署成本和提升检测效率这三者之间,看似不可调和的三角关系,如今被长亭科技和趋境科技的合作成功破解。
AI Infra新秀入局:降低部署门槛
这是掌握垂直行业场景的公司与AI基础设施技术公司合作的典型案例。
长亭科技是国内顶尖的网络信息安全公司,专注于为企业级用户提供智能、简洁的安全防护产品和解决方案。而趋境科技是一家AI基础设施领域的新兴企业,致力于构建和开发大模型推理加速平台,提供高效、低成本的大语言模型推理服务。
趋境科技不久前联合清华KVCache.AI团队发布了开源项目KTransformers(https://github.com/kvcache-ai/ktransformers)。该项目通过利用MoE模型和长文本注意力算子的稀疏特性,采用异构划分策略,大幅提升了超大模型和超长文本的推理性能,显著降低了本地部署的门槛。使用KTransformers,仅需12GB显存和百余GB内存就能在本地运行千亿参数大模型,如Mixtral 8x22B和DeepSeek-Coder-V2,性能比Llama.cpp提升数倍。
该技术使得千亿参数大模型的本地使用成本降低了10倍以上。
尤其在安全场景中,对于长文本推理的优化效果显著,即使面对1M长度的上下文,KTransformers也能在仅配备24GB显存的设备上运行,生成速度高达16.91 token/s,比Llama.cpp快10倍以上,同时维持接近满分的精确度。
项目开源后,迅速吸引了Hugging Face等平台的关注,并在国内外社区引发了广泛讨论。
大模型落地:千行百业的必经之路
随着AI基础设施日益完善,大模型安全需求日渐增多,长亭科技也迅速注意到了趋境科技的技术优势。
由于问津(ChaitinAI)安全大模型同样具备参数和注意力的稀疏性,与趋境科技的技术战略高度契合,双方迅速展开合作,采用KTransformers的技术对问津(ChaitinAI)安全大模型进行升级,问津(ChaitinAI)安全千亿大模型方案因此应运而生。
双方的合作不仅是对技术实力的验证,也是对行业场景落地能力和解决方案交付能力的体现。
大模型的快速落地离不开行业场景公司与AI基础设施公司的密切合作。未来,随着AI技术的不断发展和行业需求的增加,更多这样的合作将会涌现,不仅推动技术层面的创新,也将在安全、伦理、治理等多个维度展开探索,推动大模型在千行百业中的深度应用。
问津(ChaitinAI)千亿大模型解决方案试用链接:https://jsj.top/f/lzjQag
问津官网:https://www.chaitin.cn/zh/chaitinAI
KTransformers 开源链接:https://github.com/kvcache-ai/ktransformers
趋境科技官网:https://approaching-ai.com/
国内直接使用ChatGPT4o:
谷歌浏览器直接使用:https://www.nezhasoft.cn
-
无需魔法,同时支持手机、电脑
-
个人独享
-
ChatGPT4o mini永久免费
-
支持Copilot、DALLE AI绘画、上传文件等
长按识别下方二维码,备注:南阳,发给你