本书介绍
统计领域不断受到科学和工业带来的问题的挑战。在早期,这些问题往往来自农业和工业试验,范围相对较小。随着计算机和信息时代的到来,统计问题在规模和复杂性上都发生了爆炸。数据存储、组织和搜索领域的挑战导致了“数据挖掘”的新领域;生物学和医学中的统计和计算问题创造了“生物信息学”大量的数据在许多领域产生,统计学家的工作是理解所有这些:提取重要的模式和趋势,并理解“数据说明了什么”。我们称之为从数据中学习。
从数据中学习的挑战导致了统计科学的革命。由于计算起着如此关键的作用,这种新的发展由计算机科学和工程等其他领域的研究人员完成也就不足为奇了。我们考虑的学习问题可以大致分为监督学习和非监督学习。在监督学习中,目标是基于许多输入度量来预测结果度量的值;在无监督学习中,没有结果度量,目标是描述一组输入度量之间的关联和模式。
这本书是我们试图将学习中许多重要的新思想聚集在一起,并在统计框架中解释它们。虽然需要一些数学细节,但我们强调的是方法和它们的概念基础,而不是它们的理论属性。因此,我们希望这本书不仅能吸引统计学家,也能吸引各种领域的研究人员和实践者。
本书目录
本书内容截图
往期精品内容推荐
关于NLP相关技术全部在这里:预训练模型、图神经网络、模型压缩、知识图谱、信息抽取、序列模型、深度学习、语法分析、文本处理
Reza Zafarani经典教材-《社交媒体挖掘》PDF+随书课件打包分享