【S2024030网安毕设之基于机器学习多算法模型(随机森林+SVM)的恶意网址检测可视化管理系统】 https://www.bilibili.com/video/BV1yH4y1j7RF/?share_source=copy_web&vd_source=3d18b0a7b9486f50fe7f4dea4c24e2a4
数据集kaggle获取、原始数据集约40万条,采用双算法模型实现恶意网址预测 技术栈:python+flask+随机森林+E chart+SVM
2.主要问题及重点难点:
主要问题:基于字符串本身进行特征提取,基于sklearn库的机器学习搜型进行分类,进而预测网址是否为恶意网址。
重点:清选数据及数据标准化,对数据进行分析与处理。
难点:机器学习算法模型的选择如何更具代表性、各参数权重比对不同模型预测结果的影响。
3.预期结果:
将url等相关数据作为训练数据和测试数据,进行视型训炼和预测评估。最后,使用训练好的模型可以达到预测网址是否为恶意网址的效果。
算法调优并对数握进行分析与研究以期得到较为准确的预测算法型。
最后利用机器学习算法知识与pylhon编程技能完成网址恶意性预测算法的研究。