首先讲一下爬虫原理:其实就是爬取我们想要抓取信息的网页,从所爬到的网页代码中提取出我们想要获取的信息,这就需要我们掌握基本的html,能大概看得懂html即可。这时,我们需要用到requests库,就是发起请求访问一个网页(填写对应的url),它能够很快的获取到html源文件,然后从中筛选出我们想要的内容,即为爬虫的基本原理。
一、requests库安装(Window系统):
1.1 首先得知道目前python装在哪里
在cmd输入where python
1.2 通过cmd进入该python目录的scripts文件夹
1.3输入pip install requests命令
在输入命令前,先进目录看一下有没有安装pie.exe
有安装的话,即可输入pip install requests命令,然后耐心等候安装