网络安全大模型是指使用大量数据和参数来训练的人工智能模型,它可以理解和生成与网络安全相关的内容,例如漏洞报告、利用代码、攻击场景等。
目前各家网络安全厂商也纷纷跟进在大模型方面的探索,但可供广大从业者研究的特有网络安全大模型屈指可数,最近,云起无垠开源了他们的网络安全大模型SecGPT,该模型基于Baichuan-13B训练,目前已接近300star,这里直接拷贝了项目的介绍内容:
1. 基座模型:Baichuan-13B
-
基于Baichuan-13B (无道德限制,较好中文支持,显存资源占用小)
-
运行环境:
-
webdemo推理: 2*4090(24G)
-
lora训练: 3*4090(24G)
-
2.微调技术
-
基于Lora做预训练和SFT训练,优化后的训练代码展示了训练的底层知识,同时大幅减少训练的显存占用,在3*4090上训练。