异常检测 Task3

最新推荐文章于 2024-07-12 11:00:36 发布

新西兰孙一峰

最新推荐文章于 2024-07-12 11:00:36 发布

阅读量186

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_43834407/article/details/112789600

版权

#coding:utf-8
#导入warnings包，利用过滤器来实现忽略警告语句。
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pyod.utils.data import generate_data

# 读取数据
Train_data = pd.read_csv('breast-cancer-unsupervised-ad.csv')

# 分割数据
contamination = 0.1
n_train = 1000
n_test = 300 

X_train,y_train,X_test,y_test = generate_data(n_train=n_train,
                                             n_test=n_test,
                                             contamination = contamination)

# 使用PCA
from pyod.models.pca import PCA

# train PCA detector
clf_name ='PCA'
clf = PCA()

# fit the model
clf.fit(X_train)

# get the prediction labels and outlier scores of the training data
y_train_pred = clf.labels_ # binary labels (0: inliers, 1: outliers)
y_train_scores = clf.decision_scores_  # raw outlier scores

# get the prediction labels and outlier scores of the test data
y_test_pred = clf.predict(X_test)  # outlier labels (0 or 1)
y_test_scores = clf.decision_function(X_test)  # outlier scores

y_test_pred_proba = clf.predict_proba(X_test) # the probability of being an outlier

#可视化结果
from pyod.utils.example import visualize
print(visualize(clf_name, X_train, y_train, X_test, y_test, y_train_pred, y_test_pred, show_figure=True))

在这里插入图片描述

# 使用HBOS
# HBOS: Histogram-based Outlier Score
from pyod.models.hbos import HBOS
from pyod.utils.data import evaluate_print

contamination = 0.1
n_train = 1000
n_test = 300 

X_train,y_train,X_test,y_test = generate_data(n_train=n_train,
                                             n_test=n_test,
                                             contamination = contamination)
clf_name = 'HBOS'
clf = HBOS()
clf.fit(X_train) # 注意训练模型的时候，不需要输入y参数

# 得到训练标签和训练分数
y_train_pred = clf.labels_   # 0正常，1异常
y_train_scores = clf.decision_scores_  # 数值越大越异常

# 用训练好的模型预测测试数据的标签和分数
y_test_pred = clf.predict(X_test) 
y_test_scores = clf.decision_function(X_test)  

# 评估并打印结果
print("\nOn Training Data:")
evaluate_print(clf_name, y_train, y_train_scores)
print("\nOn Test Data:")
evaluate_print(clf_name, y_test, y_test_scores)

# 可视化模型效果
visualize(clf_name, X_train, y_train, X_test, y_test, y_train_pred,
          y_test_pred, show_figure=True, save_figure=True)

在这里插入图片描述

新西兰孙一峰

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
异常检测 Task3

#coding:utf-8#导入warnings包，利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom pyod.utils.data import generate_data# 读取数据Train_data = pd.rea
复制链接

扫一扫