学习笔记（九）：使用支持向量机识别XSS

最新推荐文章于 2024-03-29 19:40:57 发布

林咚咚

最新推荐文章于 2024-03-29 19:40:57 发布

阅读量546

点赞数

分类专栏：算法 python web安全

本文链接：https://blog.csdn.net/weixin_39878297/article/details/83062947

版权

python 同时被 3 个专栏收录

21 篇文章 1 订阅

订阅专栏

web安全

14 篇文章 3 订阅

订阅专栏

算法

13 篇文章 1 订阅

订阅专栏

1.特征化：提取特征，对特征进行向量化，标准化，均方差缩放，去均值操作

def get_len(url):
    return len(url)
def get_url_count(url):
    if re.search('(http://)|(http://)',url,re.IGNORECASE):
        return 1
    else:
        return 0
def get_evil_char(url):
    return len(re.findall("[<>,\'"/]",url,re.IGNORECASE))
def get_evil_word(url):
    return len(re.findall("(alert)|(script=)(%3c)|(%3e)|(%20)|(onerror)|(onload)))

min_max_scaler = preprocessing.MinMaxScaler()
x_min_max=min_max_scaler.fit_transform(x)

2.数据打标：XSS标记为1，正常访问标记为0。

3.数据拆分：将数据区分成训练组和测试组。

x_train,x_test,y_train, y_test=cross_validation.train_test_split(x,y,test_size=0.4)

4.数据训练：我们使用最简单的核函数linear

clf = svm.SVC(kernel='linear',C=1).fit(x,y)
joblib.dump(clf, "xss-svm-200000-module.m")

7.模型验证

clf = joblib.load("xss-svm-200000-module.m")
y_test = []
y_test = clf.predict(x)
print metrics.accuracy_score(y_test,y)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

林咚咚

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

支持向量机算法识别XSS.zip

02-15

本项目"支持向量机算法识别XSS.zip"是一个结合了SVM算法与网络安全的示例，旨在帮助学习者理解如何利用SVM来检测和预防XSS攻击。项目提供了一个数据集和训练脚本，方便用户实践并深入理解SVM在XSS识别中的应用。 ...

XSS漏洞检测和利用

2401_84434570的博客

04-22

1004

通过构造一些特殊的xss poc，在可能出现XSS漏洞测试点将这些语句传入网站，我们就能过够相对轻松的探测出XSS漏洞。

参与评论您还未登录，请先登录后发表或查看评论

毕业设计：基于深度学习的SQL注入检测XSS攻击识别系统

毕设帮助,疑难解答,欢迎打扰!

03-29

968

毕业设计：基于深度学习的SQL注入检测XSS攻击识别系统通过深度学习模型的构建和训练，系统能够自动学习和识别潜在的SQL注入和XSS攻击，准确地检测恶意行为并防止安全漏洞的利用。博文详细介绍了系统的架构和关键技术，包括数据集的构建、特征提取、深度学习模型的设计和训练等。通过实验和评估，展示了系统在不同场景下的高效性和准确性。本课题为计算机毕业设计提供了一个创新的方向，为毕业生提供了一个有意义的研究课题。无论您对深度学习技术、机器学习、信息安全、算法或人工智能的领域的同学，帮助您在网络安全领域取得突破性的成果

【应用篇】支持向量机SVM识别数字集（数据采集+模型训练+预测输出）

拨雪寻春，烧灯续昼

03-30

6461

使用SVM和OPNECV做了简单的数字识别和采集，电赛可用版

基于svm算法的简单XSS攻击识别模型

weixin_34220963的博客

04-13

1287

学习机器学习已经有段时间了，心里一直在寻思着如何将其运用在安全上，前几天刚好看到兜哥的那篇文章，于是花了两天时间实现了一个简单的基于svm的xss过滤器，这里做一个比较接地气的分享。 1.概念理解首先还是科普一些基础概念，什么是SVM，SVM叫支持向量机，是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的，根据有限的样本信息在...

使用支持向量机识别XSS

MrLeaper 的博客

02-10

861

基于web日志特征，这里选取了四个特征，分别是：url长度、url中包含的第三方域名的个数、敏感字符的个数、敏感关键字的个数def get_len(url): return len(url) def get_url_count(url): if re.search('(https://)|(https://)',url,re.IGNORECASE): return ...

深入探索：使用浏览器开发者工具进行XSS测试

热门推荐

hzeyuan.cn

01-03

1万+

最近在学xss，碰巧在github上发现了这个xss注入检测工具. 自己看代码，是学习xss注入的一个好方法。 github地址：https://github.com/shawarkhanethicalhacker/BruteXSS-1 关于xss的原理可以参考下面这篇文章，我感觉写的挺好。当然下次我也可以自己写一个总结下咯！！！ https://www.cnblogs.com/phps...

基于textCNN模型的XSS攻击检测

正在成为 code ape

03-07

1110

使用TextCNN（Convolutional Neural Network for Text Classification）模型对XSS（Cross-Site Scripting）攻击进行检测的详细步骤、原理、代码

《Web安全之机器学习入门》笔记：第九章 9.3 支持向量机算法SVM 检测XSS攻击

mooyuan的博客

02-01

848

本小节是通过网上搜集的数据使用svm算法识别XSS攻击。一、支持向量机 支持向量机SVM（support vector machines）是一种二分类模型，它的目的是寻找一个超平面来对样本进行分割，分割的原则是间隔最大化，最终转化为一个凸二次规划问题来求解。二、数据集构造黑白样本，黑样本20w，白样本20w etl('../data/xss-200000.txt',x,1) etl('../data/good-xss-200000.txt',...

支持向量机识别XSS攻击

ailx10

11-20

281

什么是支持向量机？SVM是机器学习领域使用最广泛的算法，通常用于模式识别、分类和回归分析，特别适合非黑即白的网络安全应用场景。假设只有二维的特征向量，我们需要解决一个分类问题，需要区分正常用户和黑客？如果可以通过一条直线区分，那么这个问题就可以线性区分，如果不行就叫不可线性区分。假设一个问题是可以线性区分的，那么这个区分的直线，就叫做超平面，距离超平面最近的样本，就叫支持向量。对于不可线性区分的情...

SVM算法检测XSS注入

ielcome2016的博客

04-14

969

目录 XSS注入检测 GitHub地址: https://github.com/ielcome2017/xss.git 1. 项目结构 2. 过程 3. 结果 4. 使用 GitHub地址: https://github.com/ielcome2017/xss.git 1. 项目结构 data 存放所有的数据 cache | 中间数据 model | 存放训练后的模型...

支持向量机(SVM)算法应用——人脸识别

Counting_Stars的博客

07-26

3926

环境简述:python3.6.4 根据python2.7版本代码进行勘误 Class RandomizedPCA is deprecated; RandomizedPCA was deprecated in 0.18 and will be removed in 0.20. Use PCA(svd_solver=’randomized’) instead. The new im...

使用支持向量机算法区分黑白

不忘初心，护天下安全！

02-21

454

本博客是学习《Web安全之机器学习入门》的笔记。 支持向量机算法可以在这里看：https://blog.csdn.net/qq_37865996/article/details/84555680 这个算法在这里的应用，自然是想找到一个超平面，划分普通用户和黑客，距离超平面最近的用户样本成为支持向量。在支持向量机中，很多时候都是不可线形区分的情况，虽然增加维数可以解决这一问题，但是由此造成的“维...

深度学习驱动的Web安全：静态分析与漏洞识别

论文中提到的“使用深度学习静态识别Web漏洞”，指的是通过训练深度学习模型，对Web应用程序的源代码或者二进制代码进行无执行状态的分析，以发现潜在的安全漏洞。这种方法相较于传统的动态分析（运行时监测）具有...