一直很好奇爬虫是什么,怎么爬取的数据,正好暑假实习学习到了python,虽然我好像白白浪费了考研中最珍贵的一个月,今天看了一些帖子,借着暑假装好的软件,做一下爬虫吧!
我一直都没有安装request,然后今天还以为随便装一下就好了,然后才发现是需要在所用到的python的scripts文件夹下安装request才可以,然后就是写代码了。(pip install requests就在命令行中安就好)
首先先把request包导入进去,这样才能发出请求,
requests.get //使用requests类库,以get的方式请求百度,然后把服务器返回的结果封装成一个对象,用变量resp来接受它
resp.content //这是打印的是所爬取网页的源码,而不是内容
详细参看python爬虫入门教程(二):开始一个简单的爬虫_笔墨留年。-CSDN博客_爬虫python入门