智能Web算法第二版前言和译者序

人工智能和机器学习技术近年来得到了飞速的发展,并成为计算机界乃至全社会炙手可热的话题。这些优秀技术让每个人的生活越来越方便和智能,这让从业者们都感到非常欣喜。在众多有关机器学习和数据挖掘的书籍里,《智能Web算法》一书是颇为经典的一本,其特点之一是内容覆盖面很全,有关网络数据挖掘的方方面面都涉及到了,从数据采集、存储,到降维运算和结构抽取,以及涉及模式识别的聚类和分类、统计机器学习理论等,还有面向互联网应用的推荐系统、搜索引擎、广告点击预测等,包括配套的效果评估机制也有专门的章节进行了讲解,完成一个数据挖掘应用所涉及的方方面面都覆盖到了,读者阅读本书后可以形成较为全面的知识体系。


特点之二是本书较好的在算法思想、数学原理、应用案例之间找到了平衡点。每个章节作者都由浅入深的讲解了算法的思想,并通过列举一些非常生动的案例来让读者更好的理解算法原理,例如列举的Iris数据结构抽取、在线电影推荐系统、金融欺诈检测、广告点击预测等实践案例的讲解都非常的清晰易懂。书中对数学公式的使用点到为止,力求简洁。这样既不像很多教科书堆砌数学公式让很多读者望而生畏,又不像很多书籍只是罗列程序代码而不讲解背后的算法思想。这是和作者既有工程实践经验,又有学术研究背景密不可分的。

 

与通常的再版书籍只是做些局部修订不同,《智能Web算法》的第二版对全书的内容进行了全面彻底的升级改写,全书有超过80%的篇幅与第一版不同,可以说是脱胎换骨的变化,这些变化具体体现在以下三方面:


首先是增加了近年来数据挖掘领域最新的一些研究成果,例如当下炙手可热的深度学习等,同时删减了一些较为陈旧的内容。其次调整了全书的组织结构,章节的划分更为合理,每章内容更加丰富,列举的案例也更贴近实战。第三是全书的示例代码不再使用第一版的小众开发语言BeanShell,而是改为机器学习界更加常用的Python,并配合机器学习界知名的开源软件包scikit-learn,让本书的代码阅读起来更友好,也大大增强了示例代码的实用性。

 

 本书由于篇幅所限,虽然涉及的面很宽广,但是每个章节的内容都没有进一步深入的展开,我在翻译过程中,觉得本书有些内容讲的略偏浅显,在所提及的领域都属于入门级的深度,读起来有些意犹未尽。事实上如果深究起来,本书每个章节的内容都足够扩充成一本独立的书籍了。好在本书作者提供了很多参考资料,并在相应章节的脚注里细心作了标识,对更深入的内容感兴趣的读者,不妨按图索骥,去下载相应的论文和著作来一窥究竟。

 

《智能Web算法》(第二版)为读者们提供了设计和创造智能算法的路线指引,本书汲取了计算机科学领域的很多知识,包括机器学习和人工智能,并结合了很多作者的实践和思考。书中融入了不少实际操作技巧,介绍了本领域最新涌现的前沿技术,还提供了若干真实可行的实例,读者可以对其修改后在实践中使用。

 

智能Web算法第二版

京东购买链接如下:

https://item.jd.com/12114937.html



本书适用的读者

 

本书主要针对已掌握了扎实的编程技能和基本数学和统计知识的智能算法初学者。在本书写作过程中我们尽量淡化数学推导,更多的勾勒方法的适用性和整体印象。当然如果你更愿意探究数学内容,我们鼓励你深入推敲细节。本书的读者最好能具备基本的程序经验并修学过大学的数学课程。

 

路线图

 

本书由8个章节和一个附录构成:

 

第一章介绍了智能算法的概况和一些关键特性,也提供了本书其余部分的整体指引。

第二章讨论了数据内部的结构的概念,尤其是介绍了特征空间的概念,在本章中我们详细讲解了期望最大方法和特征向量。

第三章介绍了推荐系统。我们介绍了协同过滤技术,并讨论了Netflix竞赛。

第四章概述了分类技术,介绍了逻辑回归算法,并使用了逻辑回归技术来解决缺陷检测问题。

第五章通过一个案例来讲解了在线广告中的点击预测问题,我们概述了在线广告系统的后台运作机制,并基于一个公开的网页点击数据集,提供了一套可运转的点击预测程序实例。

第六章是关于深入学习和神经网络的内容。我们对神经网络进行了的短暂精要的介绍,从神经网络的最初原型,到近年来深度网络学习的最新进展都有涉猎

第七章概述了如何做出最优的选择。我们讨论了A/B测试中统计的重要性,以及将多臂赌博机技术用于在线学习的若干种方法。

第八章介绍了智能Web的前瞻性总结。

附录讨论了我们应该如何处理快速变化的事件流和用于构建智能算法。我们讨论了几种Web日志处理的设计模式,提炼了几种需要避免的关键误区。

 

大部分情况下,这些章节内容独立可以分别阅读,但是第五章的案例分析依赖于在第四章中所介绍到的逻辑回归的知识。

 

资料下载

 

本书中运行实例时用到的所有代码和数据都可以从下面这个出版社的网站上下载到(www.manning.com/books/algorithms-of-the-intelligent-web-second-edition),或者从GitHub下载(https://github.com/dougmcilwraith/aiw-second-edition)。唯一例外的是Criteo Display Challenge数据集,因为尺寸很大,你需要从Criteo的官网直接下载,第五章提供了下载方式的说明。

 

所有代码都已经在Ubuntu 14.04.2环境下用Python2.7.10测试过。各种运行依赖关系在下载包中的需求文件中可以找到。在文件中也可以找到确保本书中代码样例兼容性的运行环境的说明书。

 

编码规范

 

本书提供了很多程序示例,以列表形式展示的源代码和文本中的代码词汇都用定宽字体表示以和普通文本区分开来。我们在部分区域增加了换行符或调整缩进符,以让书页容纳的下较长的代码。在代码过长的情况下我们甚至使用了行连接符(➥)。另外当源代码在文章中已有介绍的时候,有时我们也会把代码中的注释去掉。在代码列表中有时伴随一些注释来突出说明重要的概念。

 

 

数学规范

 

文章中会使用很多数学公式来辅助说明代码和概念。全书中我们都遵循了标准的公式标记规范,矩阵采用正体加粗大写字母表示,例如M,正体加粗小写字母表示向量,如v,标量则用斜体小写字母表示,例如λ

 

 

关于作者

 

DOUGLASMCILWRAITH博士获得了剑桥大学计算机科学系学士学位,而后在帝国理工大学获得了博士学位。他是一位机器学习专家,目前他在位于伦敦的一家广告网络公司担任数据科学家职位。他在分布式系统、普适计算、通用感知、机器人、以及安全监控方面都贡献了研究成果,他为让技术更好的服务人们的生活而无比激动。

 

H ARALAMBOS MARMANIS博士是将机器学习技术引入工业解决方案的先驱,在专业软件研发方面拥有25年经验。

 

D MITRY B ABENKO为银行、保险、供应链管理、商业智能企业等设计和开发了丰富的应用和系统架构。他拥有白俄罗斯国立信息和无线电大学计算机硕士学位。

 

作者在线

 

购买《智能Web算法》后可以免费访问Manning出版社的内网论坛,在这里你可以对本书进行评论、询问技术问题、获得来自作者和其他读者的帮助。在浏览器中输入www.manning.com/books/algorithms-of-the-intelligent-web-second-edition,注册后可以获得论坛的访问信息、了解能获得的帮助、以及论坛的用户行为守则。

 

Manning承诺为读者间以及读者与作者间提供有意义的交流场所,但并不保证作者参与其中讨论的程度,因为作者在线上的交流工作都是由作者志愿(而且不收费)参与的。我们建议你试着向作者们提出有深度的问题,别让他们觉得乏味!在书籍发行期间,通过出版社的官方网站,大家将能够访问作者在线论坛以及之前的讨论内容。

 

关于封面图片

 

《智能Web算法》(第二版)的封面图片来自于一本1706年出版的介绍特色服装的法文书籍《Encyclopedie des Voyages》,作者是J. G. St. Saveur。在当时,旅游还是一个很新鲜时髦的事情,类似该书的这样的手册很受欢迎,无论是旅行家还是足不出户的读者,都能从书中了解到世界上各个地区的风土人情,以及法国和欧洲各地区的特色服饰。

 

《Encyclopedie des Voyages》一书中用丰富的图片生动地展示了200年前世界各地别具特色的风情。在那个时代,即使来自相隔不过十来英里远地方的两个人,也可以通过衣着装扮被轻易的区分出来。不仅如此,在当时通过一个人的服饰就能轻易地判断出这个人的社会地位、行业和种族。同样在那个年代里,人们都十分陶醉于异国情调,尽管大多数人难以亲自去远方旅行。

 

在那以后,不同地区之间服饰的差异在逐步缩小,以往各地区间丰富的多样性也渐渐消褪。如今仅根据服饰已经很难区分来自不同大洲的人。或许乐观地来看,我们告别了一个文化和服饰极具特色的世界,换来了多姿多彩的个人生活,或者说得到了更丰富精彩的智能科技的生活。

 

本书的封面图片取自两个世纪前的这本服饰书籍,我们和Manning出版社一起,用旅游手册里这幅极具民族部落特色的服饰图片,来赞颂计算机产业的创造力、进取心、和无穷的乐趣。

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值