在TensorFlow热起来之前(Python人工智能),很多人学习python的原因是因为想写爬虫。的确,有着丰富第三方库的python很适合干这种工作。
Scrapy是一个易学易用的python爬虫框架,尽管因为互联网多变的复杂性仍然有很多爬虫需要自己编写大量的python代码,但能够有一个相对全面均衡的基础框架,工作还是会少许多!
从结果中可以看到,我们的python爬虫已经执行了,并获取了正确的结果。如果不想看到执行过程中的日志输出,可以增加 --nolog参数,如下所示:
最后是修改python爬虫程序,将原来在python爬虫中直接的数据显示,修改为规范的返回item数据单元,为了同原来的python爬虫做比较,我们直接另外增加一个python爬虫程序来应用新功能: