基于PySpark的网络服务异常检测系统 阶段总结(三)

这篇博客详细介绍了利用PySpark进行网络服务异常检测的方法,重点探讨了使用SVDD(Support Vector Data Description)算法和Isolation Forest算法。通过sklearn的svm.OneClassSVM进行SVDD的单分类异常检测,并采用cross_validation进行参数调优。接下来的内容将涉及SparkSQL和mllib实现的kMeans算法预测。
摘要由CSDN通过智能技术生成

本篇博文主要介绍如何使用SVDD算法和Isolation Forest算法来进行异常检测

首先是SVDD算法,主要是用sklearn里面的svm.OneClassSVM()来做单分类的异常检测,用cross_validation作为交叉验证调参

 1 import numpy as np
 2 from sklearn import svm
 3 from sklearn.cross_validation import train_test_split
 4 
 5 class Calculator_timeout(object):
 6     def __init__(self,Appid):
 7         self.Appid = Appid
 8         #这里的self.respondse_list和self.request_data_list分别是待训练的数据集列表  我这里是从MySQL数据库中通过SparkSQL取的,后面会详细介绍  
 9         self.X1 = np.array(self.respondse_list)
10         self.y1 = np.array(self.request_data_list)
11         self.y = range(0, len(self.X1))
12         self.X = np.c_[self.X1, self.y1]
13         self.X_testt = self.X[len(self.X)-360:]
14 
15 def get_best_parameters(self):
16         X_train, X_test, y_train, y_test = train_test_split(
17             self.X, self.y,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值