- 博客(4)
- 收藏
- 关注
原创 Python 数据可视化学习笔记 之高维数据可视化及其方法
一、高维数据高维数据泛指高维(multidimensional) 和多变量(multivariate)数据-- 高维是指数据具有多个独立属性 -- 多变量是指数据具有多个相关属性高维数据可视化的挑战:如何呈现单个数据点的各属性的数据值分布,以及比较多个高维数据点之间的属性关系,从而提升高维数据的分类、聚类、关联、异常点检测、属性选择、属性关联分析和属性简化等任务的效率。说明:1.聚类:聚类是一种无监督学习的手段,其目的是使相似数据点分布在同一类中,而不同数据点处于不同类中或者噪声中.
2021-11-23 21:46:31 6725
原创 Python 学习笔记 数据可视化之华夫饼图简介+百分比堆积华夫饼图
华夫饼图展示总数据的组类别情况的一种有效图表 华夫饼的小方格用不同的颜色表示不同的类别,适合快速检视数据集中不同类别的分布和比例,并与其他数据集的分布和比例进行比较。分类:1.侧重展示类别数值的堆积型块状华夫饼图;2.侧重展示类别占比的百分百华夫饼图;3.点状华夫饼图(dot waffte chart)绘制点状华夫饼图:以点为单位显示离散数据;每种颜色的点表示一个特定类别,并以矩阵形式组合在一起;适合用来快速检视数据集中不同类别的分布和比例;与其它数据集分布和比例比较,
2021-11-19 21:44:20 2294
原创 Python学习笔记 数据可视化
1.箱线图1. 什么是箱线图?箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。可显示一组数据的最大值、最小值、中位数、以及四分位数 可以用来反映一组或多组连续型定量数据分布的中心位置和散布范围四分位数(4-分位数)是3个数据点,把数据分布均匀划分成4部分,每部分包含25%的数据。Q1(称为下四分位数)和Q3(称为上四分位数)分别为数据排序后位于25%和75%位置上的值,Q2是中位数。IQR=Q3-Q1上限=Q3+1.5IQR 下限=Q
2021-11-15 19:57:59 657
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人