具体步骤:
1.首先通过requests来发送HTTP请求
注:没有requests的可以通过以下指令安装:
Windows操作系统:pip install requests
Mac操作系统:pip3 install requests
inux操作系统:sodo pip install requests
2.定制请求头
3.添加代理IP定制
代理IP:使用代理IP可以使我们不会因为爬取次数过多而遭到封禁(代理IP获取地址已放到最后)
4 .爬取对象网址,在这里我所爬取的对象是豆瓣
5.设置所需要传递的参数
注:这里的"search_text:love"(表示搜索的是关于love的),cat:1003(表示为音乐),如果出现多个参数,每个参数需要用“,”隔开
6.设置请求头及方式及传递参数
7.打印结果
注:第一个print是打印网址,而第二个print是打印状态,当状态为200时则表示请成功
当我们点击所打印出来的网址时会直接跳转到该网页界面,就像这样
参考资料:
代理IP地址 :
免费:https://github.com/awolfly9/IPProxyTool
https://www.zdaye.com/dayProxy.html(个人推荐)
付费:https://一元机场.com/#/dashboard