自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 总结(相关类可视化图像)

笛卡尔坐标系中,用点位置映射两个连续变量(X轴/Y轴):可叠加回归线()、置信区间、分类着色(hue参数):超过5000点易产生重叠,需结合抖动()或透明度(alpha=0.3:边际分布图()可同时显示单变量直方图/密度曲线金融分析:股票收益率与交易量关系(识别异常交易日)医疗研究:药物剂量与疗效响应(发现非线性关系)电商运营:用户浏览时长与购买金额(定位高价值群体)

2025-06-16 09:31:08 823

原创 数据可视化交互

1.可视化技术的优势:通过本次实验,发现可视化技术相比传统统计技术在数据展示方面具有显著优势。可视化图表能够直观地展示数据的分布、趋势和差异,尤其是结合交互功能后,用户体验得到了极大提升。2.交互设计的重要性:交互设计是可视化应用的关键环节。合理的交互功能可以增强用户的参与感和数据理解能力。在设计交互时,需要充分考虑用户的需求和操作习惯,确保交互的自然性和易用性。3.图表选择的依据:不同的可视化图表适用于不同的数据类型和分析需求。

2025-05-29 20:13:26 703

原创 地理特征类可视化图像

使用气泡的大小和颜色表示数据的数值大小和类别差异,位置对应具体的地理坐标。:地图以六边形网格展示数据密度,颜色越深表示数据越集中,热点区域一目了然。:用曲线/直线连接不同地理点,展示空间关联,适合分析流动数据的方向和强度。:各城市以不同大小的气泡展示,数值越大气泡越大,数量级对比明显。:常用于展示国家或地区的经济总量、人口数量、选举结果等数据。:常用于展示不同城市的销售额、人口数量、疫情感染人数等。:通过线条连接不同地理点,展示数据之间的流向和强度。:通过变形展示各区域的数值差异,直观反映变量大小。

2025-05-25 20:43:28 1834

原创 文本数据可视化

Jieba 是专门针对中文文本的分词工具,解决了中文因无空格分隔而难以直接处理的问题。:选择出现次数适中的单词作为特征,有助于平衡特征的分布,避免某些特征过于突出或过于稀疏。数据来源:实验-第六章文件夹,《师说》-韩愈.txt,尝试构造该文本内容的文献指纹。:文献指纹是一种将文本转换为数值向量的方法,使得文本数据可以用于进一步的分析和比较。:将提取的特征转换为一个固定长度的向量,每个元素代表一个特征词的出现次数。:预处理步骤是为了消除文本中的噪声,使得后续的特征提取更加准确和有效。内容要求有层次有逻辑。

2025-05-18 21:15:16 876

原创 时间趋势类可视化图像总结

时间趋势类可视化图像在数据分析中具有重要作用,它们能够帮助用户快速理解数据的动态特征和趋势。

2025-05-06 21:56:26 2104

原创 关系数据的可视化

图中以动态效果的箭头形状散点(symbol=“arrow”)表示各州的谋杀率与盗窃率数据点,每个箭头的起点对应谋杀率,终点对应盗窃率,箭头的方向和长度直观地反映了两种犯罪率之间的差异。分析数据的时候,可以从整体进行观察,或者关注下数据的分布。图的布局是一个7×7的矩阵,矩阵的行和列分别对应不同的犯罪类型,对角线上的值为1,表示每种犯罪类型与自身的相关性。在图的右侧和顶部分别绘制了谋杀率和盗窃率的边缘分布,以蓝色的核密度估计曲线(kde)呈现,核密度曲线的颜色为天蓝色,这有助于观察这两种犯罪率的分布情况。

2025-04-28 20:35:02 814

原创 分布类相关的可视化图像

直方图适合初步探索数据分布,直观展示数据的频数分布。密度图适合展示平滑的分布曲线,便于比较多个数据集的分布差异。箱线图适合快速展示数据的统计特征和异常值。小提琴图结合了箱线图和密度图的优点,适合展示复杂数据集的分布形态和统计特征。蜂巢图通过抖动数据点避免重叠,能够直观地展示数据的分布情况,尤其适用于展示离散数据的分布。

2025-04-16 13:57:09 1665

原创 绘制板块层级图

使用pandas的merge函数根据共同的键(如aisle_id和department_id)合并多个数据表,这是数据清洗和整合的关键步骤。使用groupby方法对数据进行分组,并使用nunique函数计算每个组内的唯一值数量,这是数据分析中常用的数据聚合技术。1.数据处理的重要性:在绘制图表之前,对数据进行适当的处理和聚合是非常重要的,这直接影响到图表的质量和信息的传达效果。读取绘图所用的数据,并对数据进行处理将数据处理成我们可以使用的形式,绘制板块层级图,设置标签和标题。

2025-04-14 20:28:29 394

原创 局部与整体类可视化图像

a.基因学中的基因重叠分析、用户群体交集统计、逻辑关系教学。(4)结果:嵌套圆形,父节点包裹子节点,面积与值成正比。a.文件目录大小分析、组织结构层级、电商商品分类占比。a.市场份额、预算分配、人口比例等单一层级占比分析。a.多层环形结构,展示层次数据,外层是内层的子分类。b.直观展示数据集的逻辑关系(并集、交集、补集)。a.生态系统分类、社交网络关系、层次化数据展示。a.用圆形或椭圆表示集合,重叠区域表示交集。a.圆形嵌套表示层次结构,面积大小反映数值。a.扇形面积表示比例,总和为100%。

2025-04-06 22:26:41 442

原创 时间数据的可视化

这里就讲述下离散型数据的堆叠柱形图,堆叠柱形图的几何形状和常规柱形图很相似,在柱形图中,数据值为并行排列,而在堆叠柱图则是一个个叠加起来的。我们实现了两种不同的堆叠柱形图(极坐标系的堆叠柱形图和南丁格尔玫瑰图),并使用雷达图展示热狗大胃王比赛的成绩,进一步加深了对数据可视化技术的理解。掌握了 pyecharts 的用法:对 pyecharts 库的使用有了深入的了解,能够灵活运用其功能来创建多种图表,并通过简单的代码实现复杂的可视化效果。二:打开cmd ,安装python所需要的第三方的包(不需要做)

2025-03-31 23:41:09 948

原创 总结(比较与排序类可视化图像)

结果:同一类别两点通过线段连接,颜色区分起始与结束值。结合条形图与刻度标记,显示实际值、目标值和性能区间。同一指标在不同时间点/组别的对比(如疫情前后数据)。绩效评估(如销售额 vs 目标)、资源使用率监控。时间周期数据(如小时/月份分布)、艺术化报告。多变量数据通过平行轴连线展示,揭示变量间关系。结果:生成垂直柱状图,条形高度反映数值大小。结果:环形布局的柱状图,不同颜色区分性别。能力评估(如技能雷达图)、产品多维度评测。结果:字体大小与词频正相关,高频词更突出。销售额对比、人口统计、不同产品性能比较。

2025-03-17 20:21:06 866

转载 Tableau数据可视化入门/D3数据可视化基础

D3 总共提供了12个布局:饼状图(Pie)、力导向图(Force)、弦图(Chord)、树状图(Tree)、集群图(Cluster)、捆图(Bundle)、打包图(Pack)、直方图(Histogram)、分区图(Partition)、堆栈图(Stack)、矩阵树图(Treemap)、层级图(Hierarchy)。为此,我们需要用到生成器。D3 的全称是(Data-Driven Documents),是一个被数据驱动的文档,其实就是一个 JavaScript 的函数库,使用它主要是用来做数据可视化的。

2025-03-16 16:05:54 84

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除