import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 列出输入目录中的文件
import warnings
from subprocess import check_output
# 忽略警告,
warnings.filterwarnings('ignore')
data = pd.read_csv('column_2C_weka.csv')
# 查看可用的情节样式
print(plt.style.available)
plt.style.use('ggplot')
# 查看特性和目标变量
# 它的默认值显示前5行(示例)。例如,如果您想查看100行,只需写入head(100)
print(data.head())
# 问题是这个数据有NaN值和长度吗,我们来看信息
print(data.info())
# 为了使数据可视化,值之间应该更接近
print(data.describe())
# pd.plotting.scatter_matrix:
# 1. 红色和绿色 绿色正常 红色异常
# 2. c: 颜色 3. figsize:形状和尺寸 4. diagonal:每个特征的直方图 5.alpha: b不透明 6. s:标志的大小 7. marker:标注类型
color_list = ['red' if i=='Abnormal' else 'green' for i in data.loc[:,'class']]
pd.plotting.scatter_matrix(data.loc[:, data.columns !&