python高维数据可视化_用pandas中的parallel_coordinates可视化高维数据

本文介绍了如何使用pandas的parallel_coordinates函数对高维数据进行可视化,以理解和展示鸢尾花数据集。通过将数据转换为DataFrame对象,然后调用parallel_coordinates方法,展示了4维数据的分布情况。
摘要由CSDN通过智能技术生成

用pandas中的parallel_coordinates可视化高维数据

可视化 pandas

1.引言

在处理数据时常常需要对数据进行可视化以便观察,但是,在笛卡尔坐标系下,超过3维的数据我们就无法可视化了,所以,我们就需要一种有效的方法来可视化高维数据.

常用的方法有Parallel Coordinates,关于这个方法的介绍可以看wikipedia页面,这里就不再重复了.

2.python解决方案

这里有一个简单的教程来熟悉pands语法:

10分钟熟悉pandas

如果对pandas的数据结构不了解,还要熟悉一下它的数据结构

Pandas 数据结构简介

材料准备齐全,就可以开始进行可视化操作了.

3. 实现过程

3.1 准备数据

首先找一个经典的4维数据集: 鸢尾花 iris数据集 wiki ,uci下载地址

数据集简要描述:

只有四个属性:

sepal length in cm

sepal width in cm

petal length in cm

petal width in cm

共三类:

Iris Setosa

Iris Versicolour

Iris Virginica

3.1.1 导入数据

由于scikit-learn已经内建了这个数据集,可以直接导入使用

fromsklearnimportdatasets

data_origin=datasets.load_iris()

data_origin是一个 python 字典, 包含了

'target_names': 标签名,'setosa' 'versicolor&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值