- 博客(13)
- 收藏
- 关注
原创 2020至2024年间中国各地空气质量监测
来源于Science Data Bank,其数据基于2014至2024年间中国各地空气质量监测站的实时监测数据。空气质量指数 (AQI) 是用于评估空气污染水平的综合指标,基于 PM2.5、PM10、SO₂、NO₂、O₃ 和 CO 的浓度,阈值由 GB3095-2012 国家标准确定。AQI 分类如下:优秀 (AQI ≤ 50)、良好 (AQI ≤ 100)、轻污染 (AQI ≤ 150)、中度污染 (AQI ≤ 200)、重度污染 (AQI ≤ 300) 和重度污染 (AQI > 300)。
2025-06-21 17:59:42
1866
原创 数据可视化交互
交互的原则、交互的分类以及常见的交互技术,尤其是几种常见的交互技术,只有熟练掌握并使用恰当,才可能设计出用户体验良好的可视化应用。尽管交互的技术有很多种,但交互技术本身并无优劣之分,选择哪种交互技术的依据是具体的场景和应用需求。例如,交互的延时性需要在用户可以接受的范围之内,并有效控制用户交互的成本。下载数据文件(data.txt),该文件表示了一些城市某天的空气质量指数(AQI),请完成如下实验。另外,交互的技术有很多种,本次实验是对文本进行可视化生成词云图片与传统的统计技术对比。
2025-06-16 23:27:39
505
原创 相关类可视化图像
图表类型主要特点适用场景优缺点散点图展示二维数据点分布,揭示变量间关系数据探索、相关性分析、异常值检测优点:直观简单;缺点:数据量大时易重叠气泡图在散点图基础上增加第三维(气泡大小)或第四维(颜色)多维数据比较(如经济指标、市场分析)优点:多维度展示;缺点:气泡过多时易混乱相关图多变量散点图矩阵,展示所有变量两两关系探索性数据分析(EDA)、特征工程优点:全面展示关系;缺点:变量多时图表密集热力图用颜色矩阵表示数值大小,强调密度或相关性矩阵数据可视化(如相关系数矩阵)、时空数据分布。
2025-06-16 07:29:27
690
原创 地理特征类可视化图像
数据聚合:统计每个单元内的数据密度或汇总值(如事件数量、人口密度)。颜色编码:使用颜色梯度来表示数值的大小,通常颜色越深表示数值越大。地理区域划分:适用于展示按地理区域(如国家、州、县等)划分的数据。面积变形:地理区域的面积与其代表的数值(如人口、GDP)成比例。事件分布:展示特定事件(如交通事故、犯罪事件)在城市中的分布。在地图上的特定位置绘制气泡,气泡的大小通常与数据值成比例。使用不同颜色填充不同的地理区域,以表示区域内的数值大小。适合展示分类或分级的数据,如疾病发病率、环境监测数据等。
2025-05-26 07:28:45
677
原创 文本数据可视化
文本是语言和沟通的载体,文本的含义以及读者对文本的理解需求均纷繁复杂。例如,对于同一个文本,不同的人的解读也是不一样的,有的人希望了解文本中涉及到的事物,而有的人希望得到文本中的关键词。文本文档的类别多种多样,包括单文本、文档集合和时序文本数据三大类,这使得文本信息的需求更为丰富。get_feature_names_out()方法用于获取特征名称,即文本中的所有不同词语。toarray()方法将稀疏矩阵转换为密集矩阵,然后使用flatten()方法将其展平为一维数组,以便于获取每个词语的TF-IDF分数。
2025-05-22 19:41:13
813
原创 时间趋势类相关的可视化图像
对于时间序列数据,如股票价格、气温变化、销售数据随月份的变化等,折线图可以帮助用户快速了解数据在不同时间点的走势,从而进行趋势分析和预测。管理综合项目:甘特图可以帮助预测时间、成本、数量及质量上的结果,帮助我们考虑人力、资源、日期、项目中重复的要素和关键的部分。河流图是堆积面积图的一种变形,通过“流动”的形状来展示不同类别的数据随时间的变化情况。河流图适合展示连续的流动数据,堆积面积图适合展示随时间变化的多个数据系列。3、堆叠瀑布图:堆叠瀑布图在变化瀑布图的基础上增加了各子数据的变化过程。
2025-05-12 08:04:37
861
原创 关系数据的可视化
其实最重要的一点,就是数据进行可视化后,呈现眼前的图表,它的意义何在。就关系数据中的关联性,分布性。直方图是反应数据的密集程度,是数据分布范围的描述,与茎叶图类似,但是不会具体到某一个值,是一个整体分布的描述。定义绘制联合分布图的函数:使用 seaborn 的 jointplot 方法绘制联合分布图,包括散点图、密度分布图和回归线。1 、请使用seaborn模块中的jointplot方法将散点图,密度分布图和直方图合为一体,数据选取murder列及burglary列,探究两种犯罪类型的相关关系。
2025-05-05 22:08:41
582
原创 比例数据可视化
板块层级图(treemap)是一种基于面积的可视化方式,通过每一个板块(通常为矩形)的尺寸大小进行度量。这段代码计算每个部门(department)中唯一的产品数量(product_name)和唯一的通道数量(aisle)进行统计和排序。merge 函数主要目的是将目标表中的数据与源表中的数据进行关联,以便根据源表中的信息对目标表进行补充或筛选。读取绘图所用的数据,并对数据进行处理将数据处理成我们可以使用的形式,绘制板块层级图,设置标签和标题。color=colors:指定每个矩形的颜色。
2025-04-21 23:31:18
812
原创 分布类相关的可视化图像
当需要探索数据的集中趋势、偏态或多峰性时,密度图能有效避免直方图分箱带来的信息割裂,通过调整带宽参数,用户能自由控制平滑程度,小带宽适合捕捉精细波动,大带宽则能弱化噪声突出主要趋势,这使得密度图对小样本数据尤为友好,既能避免直方图的随机波动,又能保留关键分布信息。:箱子的上下限,分别是数据的上四分位数和下四分位数。:直方图能够精确地表示数值数据的分布情况,是连续变量概率分布的估计分组特征:直方图通过将数据按照一定的间隔划分成一组组的区间,并统计每个区间内的数据个数或频率来展示数据的分布情况。
2025-04-20 13:06:32
707
原创 局部与整体类可视化图像
2、缺乏精确性:与其他精确表示数据的图表(如柱状图或条形图)相比,圆形的面积虽然可以反映数值大小,但很难通过肉眼精确地判断出具体的数值,尤其是在圆形大小差异较小的情况下。旭日图中每个级别的数据通过1个圆环表示,离原点越近代表圆环级别越高,最内层的圆表示层次结构的顶级,然后一层一层去看数据的占比情况。3、不适用于复杂的数据:如果数据之间的关系很复杂,使用饼状图可能不够直观,因为它只能展示单一维度的数据。韦恩图通过一系列的重叠的圆圈来表示集合,每个圆圈代表一个集合,圆圈之间的重叠部分表示集合的交集。
2025-04-07 19:50:22
1580
原创 时间数据的可视化
这里就讲述下离散型数据的堆叠柱形图,堆叠柱形图的几何形状和常规柱形图很相似,在柱形图中,数据值为并行排列,而在堆叠柱图则是一个个叠加起来的。本次实验结合本章讲述的堆叠柱形图的列子,这里我们要画的是极坐标系-堆叠柱状图,也是南丁格尔玫瑰图。不管是延续性还是暂时性的时间数据,可视化的最终的目的就是从中发现趋势。时间型数据包含时间属性,不仅要表达数据随时间变化的规律,还需表达数据分布的时间规律。最后呈现的图形如下:(这里我们画了两种极坐标的堆叠柱形图,一个是半径表示时间,一个是圆边表示时间。
2025-04-01 23:07:23
394
原创 比较与排序类相关的可视化图像
对于按时间顺序排列的数据,如不同年份的各项数据指标,环形柱状图可以有效地展示数据随时间的变化趋势以及不同时间点之间的对比情况。通过合理调整环形的半径和柱形的宽度,可以容纳大量的数据系列,使得图表在保持清晰易读的同时,能够传递丰富的信息内容。对于具有方向性的数据,如风向频率分布、雷达图替代方案等,环形柱状图可以通过柱形的角度和长度来准确地表示数据的方向和大小,增强数据的可读性和理解度。:环形柱状图的设计独特,以圆形为布局中心,柱形围绕中心环形排列,这种新颖的展示形式能够迅速吸引观众的注意力。
2025-03-24 21:50:05
880
空空如也
问一下关于蓝桥杯的问题
2024-03-27
想知道这个电路中的三极管是干嘛用的
2023-06-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1