大数据可视化课程笔记 3

第三章 时间数据可视化

3.1 时间数据在大数据中的应用

  • 时间数据是按照时间顺序排列的一系列数据值,不仅表达数据随时间变化的规律, 还要表达数据分布的时间规律.
  • 分为连续型时间数据, 离散型时间数据

3.2 连续型时间数据可视化

3.2.1 阶梯图

曲线保持在一个值,直至发生变化, 直接跳跃到下一个值,其形状类似于阶梯
Python示例:

from pyecharts.charts import Line
from pyecharts import options as opts
def draw_postage_line():
	datax = ['1995', '1996', '1997', '1998', '1999', '2000', '2001', '2002', '2003', '2004', '2005', '2006', '2007', '2008',
	     '2009']
	datay = [0.32, 0.32, 0.32, 0.32, 0.33, 0.33, 0.34, 0.37, 0.37, 0.37, 0.37, 0.39, 0.41, 0.42, 0.44]
	c = (
		Line()
			.add_xaxis(datax)
			.add_yaxis("Price", datay)
			.set_global_opts(title_opts=opts.TitleOpts(title="美国邮费阶梯图"),yaxis_opts=opts.AxisOpts(min_=0.3,max_=0.45,splitline_opts=opts.SplitLineOpts(is_show=True)))
			.render("dv_34_postage_line.html")
	)
if __name__ == "__main__":
	draw_postage_line()

3.2.2 折线图

适用于表现趋势

import pyecharts.options as opts
from pyecharts.charts import Line
from pyecharts.faker import Faker

c = (
    Line()
    .add_xaxis(Faker.choose())
    .add_yaxis("商家A", Faker.values())
    .add_yaxis("商家B", Faker.values())
    .set_global_opts(title_opts=opts.TitleOpts(title="Line-基本示例"))
    .render("line_base.html")
)

3.2.3 拟合曲线

根据给定的离散数据点绘制曲线,又称不规则曲线

3.3 离散型时间数据可视化

3.3.1 散点图

import pyecharts.options as opts
from pyecharts.charts import Scatter

data = [
    [10.0, 8.04],
    [8.0, 6.95],
    [13.0, 7.58],
    [9.0, 8.81],
    [11.0, 8.33],
    [14.0, 9.96],
    [6.0, 7.24],
    [4.0, 4.26],
    [12.0, 10.84],
    [7.0, 4.82],
    [5.0, 5.68],
]
data.sort(key=lambda x: x[0])
x_data = [d[0] for d in data]
y_data = [d[1] for d in data]

(
    Scatter(init_opts=opts.InitOpts(width="1600px", height="1000px"))
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        series_name="",
        y_axis=y_data,
        symbol_size=20,
        label_opts=opts.LabelOpts(is_show=False),
    )
    .set_series_opts()
    .set_global_opts(
        xaxis_opts=opts.AxisOpts(
            type_="value", splitline_opts=opts.SplitLineOpts(is_show=True)
        ),
        yaxis_opts=opts.AxisOpts(
            type_="value",
            axistick_opts=opts.AxisTickOpts(is_show=True),
            splitline_opts=opts.SplitLineOpts(is_show=True),
        ),
        tooltip_opts=opts.TooltipOpts(is_show=False),
    )
    .render("basic_scatter_chart.html")
)

3.3.2 柱状图

from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker

c = (
    Bar()
    .add_xaxis(Faker.choose())
    .add_yaxis("商家A", Faker.values())
    .add_yaxis("商家B", Faker.values())
    .set_global_opts(title_opts=opts.TitleOpts(title="Bar-基本示例", subtitle="我是副标题"))
    .render("bar_base.html")
)

3.3.3 堆叠柱状图

from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker

c = (
    Bar()
    .add_xaxis(Faker.choose())
    .add_yaxis("商家A", Faker.values(), stack="stack1")
    .add_yaxis("商家B", Faker.values(), stack="stack1")
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
    .set_global_opts(title_opts=opts.TitleOpts(title="Bar-堆叠数据(全部)"))
    .render("bar_stack0.html")
)
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据可视化数据科学和数据分析领域中的一个重要分支,它旨在通过可视化技术帮助人们更好地理解和分析大规模的数据集。因此,大数据可视化课程设计的方向应该紧密围绕着以下几个方面: 1. 数据可视化工具和技术:学生需要了解常用的数据可视化工具和技术,例如D3.js、Plotly、Tableau、R语言中的ggplot2等,以及它们的应用场景和优缺点。 2. 可视化数据的挑战和方法:大数据的规模和复杂性带来了许多挑战,包括数据处理和可视化。学生需要了解如何应对这些挑战,例如如何选择合适的可视化技术和如何设计易于理解和交互的可视化界面。 3. 数据可视化数据分析和商业决策中的应用:可视化技术在数据分析和商业决策中发挥着重要作用。学生需要了解可视化技术如何帮助人们更好地理解和分析数据,并做出更明智的决策。 4. 可视化技术与机器学习的结合:机器学习是一个快速发展的领域,它与大数据可视化有着密切的关系。学生需要了解如何将可视化技术与机器学习算法结合起来,以便更好地理解和解释机器学习模型。 5. 可视化技术与数据科学的结合:数据科学是一个涵盖统计学、计算机科学和领域知识等多个学科的交叉学科。学生需要了解如何将可视化技术与数据科学方法结合起来,以便更好地理解和分析数据。 最后,还需要注意的是,大数据可视化一个快速发展的领域,新的技术和方法层出不穷。因此,设计一门成功的大数据可视化课程需要不断更新和改进,以跟上最新的发展和趋势。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值