【每周一本书】之《大数据核心技术与实用算法》

大数据技术与应用展现出锐不可当的强大生命力,科学界与企业界寄予无比的厚望。大数据成为继20世纪末21世纪初互联网蓬勃发展以来的又一轮IT工业革命


编辑 | abby

官网 | www.datayuan.cn

微信公众号ID | datayuancn


大数据技术与应用展现出锐不可当的强大生命力,科学界与企业界寄予无比的厚望。大数据成为继20世纪末21世纪初互联网蓬勃发展以来的又一轮IT工业革命。


大数据技术是指从数据采集、清洗、集成、挖掘、分析与结果解释,进而从各种类型的巨量数据中快速获得有价值信息的全部技术。从数据挖掘和分析中,人们可以获取具有重要价值的信息。大数据技术的精髓是从大数据中产生新见解的能力、识别复杂关系和做出越来越精准的预测、从大数据中产生动力、获取知识和采取行动的能力。


大数据技术是现代科学与技术发展,尤其是计算机科学技术发展的重要成果和结晶,是科学发展史的又一新的里程碑。大数据的出现对计算机科学技术的许多领域提出了挑战与冲击,推动了IT技术的发展。


而今天,小编就要为大家推荐一本关于大数据技术的入门读物——《大数据核心技术与实用算法》。


从内容方面,该书共分为12个章节:


第一章:大数据技术概述,主要包括大数据技术框架、特征、大数据的冲击、大数据研究方法论、常用的大数据计算框架。


第二章:大数据获取与存储,主要包括数据获取的定义与数据获取领域、NewSQL和NoSQL、分布式文件系统、虚拟存储技术、云存储技术、分布式存储核心算法、数据仓库与数据集市、区块链技术等。


第三章:大数据抽取技术,主要包括数据抽取技术概述、增量数据抽取技术、非结构化数据抽取、Web数据抽取。


第四章:大数据清洗技术,主要包括数据质量与数据清洗、不完整数据清洗方法、异常数据清洗方法、重复数据清洗方法、文本清洗和数据清洗技术的实现。


第五章:大数据转换与约简,主要包括数据平滑、数据规范化、数据泛化、数据约简、数据压缩、数值约简、数值数据离散化与概念分层。


第六章:大数据集成技术,主要包括数据集成技术概述,数据迁移、数据集成模式、数据集成系统、数据集成系统的构建、数据聚类集成、实时数据集成、企业信息集成。


第七章:大数据分析技术,主要包括大数据分析定义与方法、数据分析的基本方法、高级数据分析、预测分析、大数据预测分析的应用趋势。


第八章:数据挖掘,主要包括数据挖掘理论基础、关联规则挖掘、分类、聚类方法、序列模式挖掘、Web挖掘技术、空间数据挖掘、非结构化文本数据挖掘。


第九章:大数据分析结果解释,主要包括数据分析结果的解释、数据的基本展现形式、大数据可视化、大数据可视分析。


第十章:大数据离线计算技术,主要包括数据离线计算概述、MapReduce的体系结构、Hadoop分布式计算平台、MapReduce程序设计实例。


第十一章:大数据流式计算技术。


第十二章:大数据交互式处理技术,主要包括交互式处理系统的问题、数据切分、数据钻取、Scala编程语言简介、交互式大数据处理框架Spark、交互式查询。



推荐阅读:


【每周一本书】之《人之彼岸》:郝景芳带你提前踏入人机交互的未知世界


【每周一本书】之《数据素养:数据使用指南》:如何将数据信息转变为迷人的故事?


【每周一本书】之《图解机器学习》:187张图解轻松入门


【每周一本书】之《大数据智能——互联网时代的机器学习和自然语言处理技术》


每周一本书之《大数据日知录:架构与算法》



本书由 数据猿联合北京师范大学出版社 共同推荐


【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社、中国人民大学出版社、中信出版社、上海交通大学出版社。


欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:wmh4178,备注“书”


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值