我的新书《Python3网络爬虫开发实战(第二版)》获得 Python 之父的推荐了!

这是「进击的Coder」的第 492 篇分享

作者:崔庆才

别急,这书现在还没上市哈,但很快了!

最近朋友们一直在催:你的第二版爬虫书怎么还不出来啊,我都等了好几年了!你不是前几个月就完稿了吗?咋这么慢?

别急,这下是真的很快就要上市了。

为啥我的第二版书“难产”了呢?原因有好多:

  • 一个就是工作原因,之前第一版书是读研期间写的,工作之后发现书中的一些案例已经过期了,于是就决定写第二版。但工作毕竟是工作,工作的内容还是需要放在第一位的,所以第二版书的内容基本都是利用下班之后或者周末的时间写出来的,所以进度很慢。

  • 另外一个就是为了解决案例过期的问题,之前耗费了很多精力自己制作了爬虫案例平台,https://scrape.center/,里面做了几十个爬虫案例,书中对这些案例进行了配合讲解,这就解决了一些案例过期的问题,也能更好地帮助读者进行练习,前前后后这个案例平台做了也有小半年的时间。

等书籍完稿之后,其实还有不少的事情,比如审稿、修改、封面设计、推荐语等等,总之步骤是很繁琐的,改天再写个文章专门介绍下写书这件事。

单独说说推荐语。

推荐语就是印在书的背面的各位专家对本书的评价和推荐内容,一般就是几句话加上专家的 Title。就在推荐语这一块上,我还憋了个“大招”,那就是让 Python 之父 Guido van Rossum 给我写个推荐语。

Python 之父想必大家应该知道是谁吧?就是 Guido van Rossum,Python 就是他在 1989 年编写出来的。

e43a809df37f35f52b09f26a6fd4b1f7.png

有人说,你还真敢想,还想让 Python 之父给你这本“名不见经传”的书写推荐语?闹呢?人家怎么可能会理你?

其实想想确实不可思议的,但我还是想试试,如果真的能拿到 Python 之父的推荐,那简直是荣幸之至!

另外由于我在微软工作,Python 之父 Guido 2020 年也宣布加入微软。所以,我和他也多少是同一个公司的了(但显然职位差距过大)。

所以,没准还是有机会的呢?

好,那么问题来了,我这书都是中文写的,Python 之父是看不懂中文的,咋办呢?难道我要把全书都翻译一遍吗?

是的,还真得是这样,我不能给个中文内容或者啥也不给就干巴巴地要求他帮我写推荐语吧?这也太滑稽了。

在此之前,有好几个月时间整本书的内容还在审稿和修改,等稿子审完的时候差不多就九月份了,然后九月份左右,我就拿到了编辑那边给到的全书审核完毕的 Word 文档,但还没正式排版。看了看,这个 Word 文档一共有 1000 多页,好家伙,我真的不敢相信我写了这么多。

但也没办法,那也得翻译一遍。

如果我全部手工翻译也太麻烦了,于是我就从网上找了一些工具,比如 Word 全文翻译工具,其背后就是对接了 Google 翻译,但这些工具还有上传大小限制,于是我就又把各个章节进行了拆分,一部分一部分地翻译完了再合并起来。

当然大家知道,Google 翻译肯定质量不能保证的吧,比如一些说法和名词就翻译不太准确,我就得进行手工审查和修改。所以我又花了好多天时间对全文进行检查和修改,包括不准确的标题、表述、名词等等。然后我还对整个目录索引重新规整了一遍。

总之整个翻译准备过程差不多也花了半个月的时间,最后翻译完了英文版差不多 1600 页,如图所示,比如目录最后一节就是 1561 页了:

26d15444a2859357299de164c4b51cb5.png
全书翻译

但是,这个其实还不够,如果把这个书丢过去,人家没时间看怎么办?我总得好好介绍下整本书的情况吧。

于是我又把书的介绍和前言又翻译了一遍,内容包括:写书的初衷、整本书的介绍、整体章节的规划,这样的话能帮助 Guido 更好地理解整本书的脉络和内容。

于是又有了如下的内容:

4b862656fd47acaa319e8b615d1bc982.png
书的介绍

好像还是不够,万一 Guido 觉得写推荐语很麻烦怎么办?如果我能给他提供几个 Draft Candidate 候选是不是更有帮助一些?这样他可以找些灵感或者稍微修改下就好了,于是我又草拟了一些候选推荐语,整理了一个文档。

嗯,好像就准备差不多了,一共三个东西:

  • 全书的翻译内容

  • 书的内容介绍

  • 候选推荐语

接下来就是联系 Guido 了,心中一阵忐忑。

为了更正式一点,我发了一封邮件给 Guido,邮件整体的内容就是:先表示下对他的感谢和敬佩,然后介绍下自己的基本情况和书的基本情况,比如我是做什么的,第一版书在中国的销量等等,接着开门见山地说想要请他帮忙写一段推荐语。然后后面就附上我的书的一些详细信息,比如我整理的全文翻译书稿、内容介绍、候选推荐语等。

内容如下:

052e9bf4377c0b1873e0bc29fda90cb2.png

我怀着十分忐忑而又激动的心情,按下了发送键。

接下来就是漫长的等待。

我每天早上醒来都会看看邮件有没有收到 Guido 的回信。

没回。

还是没回。

还是还是没回。

还是还是还是没回。

好像要凉了。

好像凉了。

好像真凉了。

真的凉了。

可能真的是太忙或者没看到我的邮件吧。

后来,我就联系了我们部门的总 Director(这里就不透露具体信息了),看看他能不能帮我 connect 一下 Guido,他爽快地答应了。

不太清楚我的Director怎么联系的,他说单独找了下 Guido,可能是发信或者内部联系。

然后第二天,他就告诉我,得到 Guido 回复了!Guido 说确实近期比较忙,也很希望能有一个 Draft Candidate 推荐语提供给他,他可以结合着书的内容来改写一下会更好。

我的 Director 人也非常好,他也给我出了很多建议,还帮我修改了下之前我写的 Draft Candidate 推荐语给他,转发了我的邮件还帮我又介绍了下。

最后,Guido 给了最终的推荐语!!

942e1c9da702f35b6bd94def0cb1d4b1.png
Guido 的回信,遮盖了部分邮件内容

收到这封邮件的时候我真的开心地要跳起来了,太开心了!我的书终于拿到了 Python 之父的推荐啦!

正文如下:

I am happy to see that Python is so widely used in the Chinese IT community. I hope this book will help more people understand Python and web crawling/scraping.                                          

—— Guido van Rossum, creator of Python, Distinguished Engineer, Microsoft

大意就是,我非常高兴 Python 能够在中国社区得到这么广泛的应用,希望本书能够帮助更多的朋友学习 Python 和网络爬虫。

嗯,整个过程比较漫长,但真的非常开心最终有了一个好的结果,真的非常荣幸能够得到 Python 之父的推荐和支持,同时也非常感谢我的 Director 帮我联系和出建议。

得到 Guido 的推荐语之后,后面的流程就很快了,还有其他各位专家的推荐语和序我也都联系好了,真的非常感谢各位专家的推荐,书中都会一一表示感谢。

现在内容也审核完毕了,最后把推荐语添加到封面上就投入印刷了!

请大家再耐心等待一小段时间,很快《Python3网络爬虫开发实战(第二版)》就要跟大家见面啦~

dc75d2a1c3ba21389f341d8d2fde9d9a.png

End

「进击的Coder」专属学习群已正式成立,搜索「CQCcqc4」添加崔庆才的个人微信或者扫描下方二维码拉您入群交流学习。

55e91749ac7be67e7c396dc8f52277b8.png

看完记得关注@进击的Coder

及时收看更多好文

↓↓↓

崔庆才的「进击的Coder」知识星球已正式成立,感兴趣的可以查看《我创办了一个知识星球》了解更多内容,欢迎您的加入:

8a2f1424f826ba89e3212a9c49f717d1.png

好文和朋友一起看~

  • 13
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
### 回答1: Python3网络爬虫开发实战第2版是一本介绍如何使用Python3编写网络爬虫实战教程。本书网络爬虫的基础知识开始,逐步介绍如何使用Python3编写爬虫程序,包括如何使用Requests库发送HTTP请求、如何使用BeautifulSoup库解析HTML文档、如何使用Scrapy框架编写爬虫程序等。此外,本书还介绍了如何使用Selenium库模拟浏览器行为、如何使用PyQuery库解析XML文档、如何使用MongoDB数据库存储爬取的数据等。本书内容丰富,适合Python初学者和有一定Python基础的读者学习。 ### 回答2: Python3是一种流行的编程语言,它已成为网络爬虫开发的首选语言。《Python3网络爬虫开发实战第2版》是一本深入解释如何使用Python来编写网络爬虫的重要参考书籍。该书覆盖了从基础到高级的各种技术,包括使用Python和第三方库进行web数据存储、数据提取、数据清洗、数据分析等。 第一部分的介绍了网络爬虫的基础概念,包括HTTP协议、HTML解析、代理和Cookie等。其中,作者对Python网络爬虫库Requests的用法进行了详细的介绍,并给出了一些常见的HTTP请求头信息。 在第二部分中,作者细察了如何使用Scrapy和Beautiful Soup等开源库进行数据抓取。这个部分的内容对于希望更深入地了解Python网络爬虫开发的人来说尤其有价值。读者将了解如何写爬虫,完成页面解析和使用数据库等数据存储技术。 第三部分深入探讨了其他有用的技术,如Selenium、PhantomJS、Tesseract OCR等。读者可以了解到如何使用这些技术来解决爬虫中遇到的困难。 最后,在第四部分中,作者重点介绍了如何使用Python进行数据分析和可视化,使读者可以更深入地了解所抓取数据的意义和价值。 总的来说,《Python3网络爬虫开发实战第2版》是一本值得一读的权威指南,向人们介绍了Python网络爬虫开发的方方面面,无论是初级编程人员还是高级开发人员,他们都可以收获丰富的知识。 ### 回答3: 《Python3网络爬虫开发实战》第2版一书由崔庆才编写。本书主要讲解Python爬虫的实际应用,包括爬虫的基础知识、数据解析、反爬虫与反反爬虫爬虫实战、分布式爬虫等内容。下面,我将从几个方面介绍一下本书。 一、基础技能篇 本书首先从基础技能开始介绍,包括HTTP协议、HTML、CSS、JavaScript等基本概念,以及Python的一些基础语法。同时,还介绍了一些常用的爬虫框架,如Scrapy等。 二、数据解析篇 爬虫最重要的就是数据解析,本书详细地介绍了爬虫中常用的数据解析库,包括正则表达式、XPath、beautifulsoup等。同时,还介绍了爬虫中常用的数据存储方式,如MySQL、MongoDB等。 三、反爬虫与反反爬虫爬虫的实际应用中,我们还需要面对反爬虫的问题。本书详细介绍了常用的反爬虫手段,如User-Agent伪装、IP代理等。同时,还介绍了如何应对反爬虫措施,如通过随机User-Agent、IP代理池等技术。 四、爬虫实战 本书爬虫的实际应用分为几个章节进行介绍,包括爬取豆瓣电影、天猫商城、京东商城等网站的数据,爬取微博、知乎等社交网站的数据等。每个实战案例都详细地介绍了爬虫的实现过程,包括数据解析、数据存储、反爬虫等方面的知识,可供读者进行参考。 五、分布式爬虫 最后,本书还介绍了分布式爬虫的实现,包括基于Redis的分布式爬虫、基于MongoDB的分布式爬虫等。这些内容将帮助读者更好地理解分布式爬虫的设计思路。 总体而言,《Python3网络爬虫开发实战》第2版是一本较为详细的爬虫书籍,涵盖了爬虫的基础知识、数据解析、反爬虫与反反爬虫爬虫实战、分布式爬虫等方面的内容。对于想要了解Python爬虫的人群,本书绝对是一本不可错过的参考书。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值