作者:禅与计算机程序设计艺术
1.背景介绍
概述
“大数据”是指海量、高维、多样化的数据集合。随着人类对数据处理和管理的需求越来越复杂,越来越依赖机器学习、人工智能等新兴技术。在过去的一段时间里,越来越多的人开始关注到“大数据”这一颗龙头。
如今,“大数据”已经成为一个新的名词,它既包含了大量的数据,也带来了巨大的价值。因此,研究、开发、应用“大数据”技术也逐渐成为各行各业的专业人才需求。在这个快速发展的时代背景下,如何快速构建和部署“大数据”架构成为一种重要且紧迫的事情。
对于“大数据”和人工智能的结合来说,实现智能数据应用架构需要面临很多挑战。例如,如何提升数据的质量、有效利用资源、提升数据分析的速度、降低成本,如何处理海量数据、如何实时产生、存储、分析和过滤数据、如何通过知识发现和洞察进行数据智能运用等。在这些情况下,我们可以参考一些前人的经验,或许可以借鉴一些成功案例,并结合自己的见解加以总结,给出一套完整的大数据智能架构方案。
在过去的几年中,大数据技术和人工智能技术的交集不断增加,已经成为今天最热门的话题。为了帮助读者更好的理解“大数据”和人工智能技术的相互作用及其应用,特别是如何构建和部署“大数据智能架构”,本系列教程将围绕以下几个方面进行阐述:
- 大数据基础理论介绍:包括概览、基本术语、存储、计算、查询、分析、可视化、安全、混合云等方面。
- 大数据与人工智能技术之间的联系及区别:包括特征工程、数据分割、数据增强、深度学习、图神经网络等方面。
- 大数据存储、计算和查询框架介绍:包括Hadoop、Spark、Flink、Storm、Beam等开源大数据框架的特性和优缺点。
- 大数据分析工具介绍