读文献“大数据可视分析综述”

本文探讨了大数据的4V特征,并围绕大数据可视分析展开,指出其结合了计算机计算能力和人的认知能力,以交互式可视化界面帮助用户理解大规模复杂数据。文中提到了文本可视化、网络(图)可视化、时空数据可视化和多维数据可视化等方法,以及在信息可视化中人机交互技术的应用。重点介绍了如标签云、TextFlow、EventRiver、边捆绑和时空立方体等可视化工具和技术。
摘要由CSDN通过智能技术生成

大数据具有4V特征,即:体量巨大(volume)、类型繁多(variety)、时效性高(velocity)以及价值高密度低(value)。
大数据分析的理论和方法研究可以从两个维度展开:一是从机器或计算机的角度出发,强调机器的计算能力和人工智能,以各种高性能处理算法、智能搜索与挖掘算法等为主要研究内容,例如基于 Hadoop 和 MapReduce 框架的大数据处理方法以及各类面向大数据的机器学习和数据挖掘方法等,这也是目前大数据分析领域的研究主流;另一个维度从人作为分析主体和需求主体的角度出发,强调基于人机交互的、符合人的认知规律的分析方法,意图将人所具备的、机器并不擅长的认知能力融入分析过程中,这一研究分支以大数据可视分析。
未来的十大挑战主要聚焦于可视分析领域所关注的核心主题:认知、可视化、人机交互的深度融合。
可视分析是一种通过交互式可视化界面来辅助用户对大规模复杂数据集进行分析推理的科学与技术。
大数据可视分析是指在大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力(insight).
根据信息的特征把信息可视化技术分为一维信息(1-dimensional)、二维信息(2dimensional)、三维信息(3-dimensional)、多维信息(multidimensional)、层次信息(tree)、网络信息(network)、时序信息(temporal)可视化。
文本可视化:
文本信息是大数据时代非结构化数据类型的典型代表,文本可视化的意义在于,能够将文本中蕴含的语义特征(例如词频与重要度逻辑结构主题聚类动态演化规律等)直观地展示出来。典型的文本可视化技术是标签云(word clouds 或 tag clouds),将关键词根据词频或其他规则进行排序,按照一定规律进行布局排列,用大小、颜色、字体等图

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值