UCI库中Mines vs. Rocks的数据集属性可视化展示

该博客通过平行坐标图和交会图对UCI库中的Mines vs. Rocks数据集进行可视化分析,探讨如何根据声纳返回的测量信息进行分类。通过观察不同分位数差异,发现样本间的相关性。平行坐标图显示样本1与样本2的相关程度高于样本2与样本30,而交会图则揭示了变量间的相关性。初步分类器建议:当样本的x_30小于0.5时,分类为M,否则为R,但这个简单的分类器仅作为起点,实际分类效果有限。
摘要由CSDN通过智能技术生成

数据集描述:
从各种不同的纵横角度获得的信号,每个样本有60个从不同地点接收到的仪器测量值(每个模式是一组60个数字,范围为0.0到1.0),最后一个标记岩石(R)和水雷(M)
任务是根据声纳返回的测量信息,进行分类,从而发现未爆炸的水雷。

data_url = "http://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/sonar.all-data"
dataset = pd.read_csv(data_url,prefix='x')   #shape(207, 61)
dataset.head()
dataset.tail()
summary = dataset.describe()
print(summary)

输出:(部分)
这里写图片描述
在这里可以观察不同分位数之间的差异。对于同意属性,如果存在某一个差异严重异于其他差异,则说明存在异常点。这就值得进一步分析数据。

手段①:平行坐标图 用于多个属性问题的可视化&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值