使用「Requests」+「bs4」写亚马逊爬虫
终于我们还是讲到用「Python」来爬数据了。有些卖家就问了,为什么要用pytho?之前不是已经有一些Chrome插件或者其他简便的方法了吗?是的没错,但是他们都还达不到指哪儿爬哪儿、无惧目标网站封杀的水平呀。
作为已经成为最受欢迎的程序设计语言之一「Python」,它除了具有丰富和强大的库之外,还被赋予“胶水语言”的昵称,毕竟它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。用它来写爬虫我们就是「站在巨人的肩膀上」,很多东西并不需要我们写,只需要库里拿过来用就行了。
话不多说,接下来小编就来叫大家如何操作!
环境搭建步骤:一、安装Python:在这里我们使用python 3.6.6版本,可在下面连接中直接下载。
Windows 版本:
https://www.python.org/ftp/python/3.6.6/python-3.6.6.exe
MacOS版本:
https://www.python.org/ftp/python/3.6.6/python-3.6.6-macosx10.9.pkg
其他版本请访问python官网:
https://www.python.org/downloads/release/python-366/
首先将「Add Python 3.6 to PATH」勾选上,点击「Customize installation」。
在将「Install for all users」勾选上,点击「install」。
安装完成后,我们来检查一下Python是否安装成功,打开cmd命令,输入python回车,若显示类似下图,证明环Python安装成功。
二、安装PyCharm:
PyChram是一款提供Python开发环境的应用程序,可以帮助我们更好的编写、调试代码。
Windows版本:
https://download.jetbrains.com/python/pycharm-professional-2018.2.exe
MacOS版本:
https://download.jetbrains.com/python/pycharm-professional-2018.2.dmg
<