【每周一本书】之《白话大数据与机器学习》

我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经渗透到每一个行业和业务领域,成为当今以及未来商业运作的基础资产。可以说,只有掌握数据并善于运用数据的人,才会在竞争日益激烈的环境中寻得先机


编辑 | abby

官网 | www.datayuan.cn

微信公众号ID | datayuancn


我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经渗透到每一个行业和业务领域,成为当今以及未来商业运作的基础资产。可以说,只有掌握数据并善于运用数据的人,才会在竞争日益激烈的环境中寻得先机。


那么我们该怎么样学习大数据分析、机器学习以及人工智能?《白话大数据与机器学习》的作者认为,学习大数据、机器学习和人工智能,所需的知识分为五个层次:


一是数学知识;


二是统计学知识;


三是算法知识;


四是工具知识;


五是哲学思想知识。


所谓工具知识,就是我们需要借助计算机软件来完成相关的分析和运算,目前大数据和机器学习领域热门的语言就是 R 和 Python。


而今天小编要为大家推荐的《白话大数据与机器学习》正是一本系统学习大数据与机器学习的入门级图书。



本书是资深大数据专家多年实战经验总结,开启了大数据与机器学习妙趣之旅。以降低学习曲线和阅读难度为宗旨,系统讲解统计学、数据挖掘算法、实际应用案例、数据价值与变现,以及高级拓展技能,并清晰勾勒出大数据技术路线与产业蓝图。


全书共分为18个章节:


第1~5章:大数据入门所需的系统性知识,剖析大数据产业、数据与信息算法等的关系,妙解数学基础(排列组合、概率、统计与分布),以及指标化运营及体系构建。这部分补足读者的产业与相关概念认知,以及所需的数学知识。为下面的数据挖掘算法的理解与应用夯实基础。


第6~8章:介绍了数据挖掘基础知识与算法,讲解了与数据息息相关的信息论。其中重点讲解了:多维向量空间(向量和维度、矩阵及其计算、上卷和下钻)、
回归(线性回归、残差分析、拟合相关问题)、聚类(K-Means算法、有趣模式、孤立点、层次与密度聚类,聚类的评估等)、分类(朴素贝叶斯、决策树归纳、*森林、隐马尔科夫模型、SVM、遗传算法)。


第11~18章:介绍生产应用与高级扩展。其中第11~15章介绍生产应用实践,涵盖关联分析、用户画像、推荐算法、文本挖掘、人工神经网络,这些也是工业界和学术界研究的热点。第16章讲解了著名的大数据框架及其安装与配置,如Hadoop、Spark、Cassandra、PrestoDB。第17章从速度与稳定性维度介绍了大数据系统的架构与调优。第18章则从数据运营、评估、展现与变现场景层面进行了解读。

附录部分给出了大数据平台运行可能需要的软件和库,以及群众如何看待炙手可热的大数据。


推荐阅读:


【每周一本书】之《大数据智能——互联网时代的机器学习和自然语言处理技术》


每周一本书之《大数据日知录:架构与算法》


每周一本书之《深度学习原理与TensorFlow实践》


每周一本书之《机器学习之路——Caffe、Keras、scikit-learn实战》


每周一本书之《深度学习算法实践》:让你一站式了解深度学习算法


点击查看更多大数据书籍……


【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社、中国人民大学出版社、中信出版社、上海交通大学出版社。


欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:wmh4178,备注“书”


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值