大数据简介_大数据描述-CSDN博客

本文链接：https://blog.csdn.net/StromCruise/article/details/118396971

大数据是指海量、高速、多样和真实的信息资产，广泛应用于仓储物流、电商、汽车、电信等领域。Hadoop是处理大数据的分布式平台，具备高扩展性、低成本和高效性，但存在低延迟访问、小文件处理及文件修改的局限。Hadoop由HDFS、MapReduce和YARN组成，其中HDFS负责分布式存储，MapReduce实现并行计算，YARN负责资源管理。

摘要由CSDN通过智能技术生成

大数据简介

大数据的定义

大数据是指无法在一定时间范围内用常规软件工具进行捕捉，管理和处理的数据集合，是需要新处理模式才能具有更强的决策力，洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据的特点

大数据的特点可以用“5V”来描述，

大量 Volume :
- 采集、存储和计算的数据量都非常大。
高速 Velocity（低延迟）：
- 在大数据时代，数据的创建、存储、分析都要求被高速处理，比如电商网站的个性化推荐尽可能要求实时完成推荐，这也是大数据区别于传统数据挖掘的显著特征。
多样 Variety：
- 数据形式和来源多样化。包括结构化、半结构化和非结构化数据，具体表现为网络日志、音频、视频、图片、地理位置信息等等，多类型的数据对数据的处理能力提出了更高的要求。
真实 Veracity：
- 确保数据的真实性，才能保证数据分析的正确性
低价值 Value：
- 数据价值密度相对较低，或者说是浪里淘沙却又弥足珍贵。互联网发展催生了大量数据，信息海量，但价值密度较低，如何结合业务逻辑并通过强大的机器算法来挖掘数据价值，是大数据时代最需要解决的问题，也是一个有难度的课题。

大数据的应用场景

随着大数据的发展，大数据技术已经广泛应用在众多行业，比如仓储物流、电商零售、汽车、电信、生物医学、人工智能、智慧城市等等领域，包括在疫情防控战中，大数据技术也发挥了重要的作用。

仓储物流
- 大数据技术驱动了仓储物流领域的智能化发展，以苏宁为例，苏宁物流可在全国的各级仓库间实现智能分仓、就近备货和预测式调拨，实现”客户需要的商品就在离客户最近的配送中心“。
电商零售
- 啤酒+尿不湿
个性化推荐（各种角度进行推荐）
” 双11购物节 “ 实时销售额大屏
汽车
- 利用了大数据和物联网技术的无人驾驶汽车，在不远的未来将走入我们的日常生活
电信
- 移动联通根据用户年龄、职业、消费情况，分析统计哪种套餐适合哪类人群，对市场人群精准定制。
生物医学
- 大数据可以帮助我们实现流行病预测、智慧医疗、健康管理，同时还可以帮助我们解读 DNA，了解更多的生命奥秘。比如影像大数据支撑下的早期肺癌支撑平台，基于大量病例数据样本，制定早期肺癌高危人群预警指标
人工智能
智慧城市
- 大数据有效支撑智慧城市发展，成为城市的”数据大脑“。比如，在智慧城市建设上，杭州始终走在全国前列。如覆盖面广的移动支付、新颖的在线医疗模式、创新的物流运输模式，都受到较大关注。2016年，杭州被《中国新型智慧城市》白皮书评为“中国最智慧的城市”。