基于深度学习的恶意 URL 识别

最新推荐文章于 2025-03-25 17:10:51 发布

Ronnyz

最新推荐文章于 2025-03-25 17:10:51 发布

阅读量5.5k

点赞数 1

分类专栏：论文阅读文章标签：网络安全恶意URL检测深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Ronnyz/article/details/106680097

版权

该文提出一种基于深度学习的恶意URL识别模型，利用URL的词法特征，通过CNN进行特征抽取和分类。实验结果显示模型准确率达到0.962，具有较高的预测效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于深度学习的恶意 URL 识别

原文作者：陈康, 付华峥, 向勇

原文期刊：计算机系统应用,2018,27(6):27–33

原文链接：http://www.c-s-a.org.cn/1003-3254/6370.html

一、论文主要内容

在本文工作中，我们提出一种基于深度学习的恶意 URL 识别模型。本文的模型基于 URL 词法特征进行检测。首先通过正常 URL 样本训练得到 URL 中的字符的分布表示。将 URL 转化成二维图像，然后通过训练 CNN 模型对二维图像进行特征抽取，最后使用全连接层进行分类。

二、作者工作

2.1 相关工作

目前的恶意 URL 识别工作使用的主要是黑名单、启发式技术和机器学习技术。黑名单技术只能给与用户最低程度的保护，并不能及时检测出恶意网站，阻断用户对恶意网站的访问。启发式算法是对黑名单技术的一种补充算法，其主要原理是利用从恶意网址中发现的黑名单相似性规则来发现并识别恶意网页。但是启发式算法有误报率高以及规则更新难等缺点。

机器学习算法通过分析网页 URL 以及网页信息，提取域名的重要特征表示，并训练出一个预测模型。有监督算法也叫分类算法，此算法的准确率较高而且误报率相对较低，但是却对标注数据以及特征工程比较敏感，标注数据的准确率以及选择使用的特征会严重影响算法的准确率和效率。无监督机器学习方法又称聚类方法。此类方法的具体分类过程主要由特征提取、聚类、簇标记和网页判别等步骤组成。主要做法是首先将 URL 数据集划分为若干簇，使得同一簇的数据对象之间相似度较高，而不同簇的数据对象之间的相似度较低。然后，通过构造和标记数据集中的簇来区分恶意网页和良性网页。

深度学习通过学习深层非线性网络结

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。