关于python爬虫,大家都很熟悉,那么我就不多说,开始做了。
首先,python爬虫先安装python库,主要是requests库,在windows中cmd中输入,pip install requests ,之后会自动安装。
之后再python IDLE 中输入import requests 无报错说明安装正确。
下面试试爬取百度页面:
最简单的方式
import requests
r=requests.get("http://www.baidu.com")
print(r.text)
返回的结果:
ç¾åº¦ä¸ä¸ï¼ä½ å°±ç¥é©2017 Baidu 使ç¨ç¾åº¦åå¿è¯» æè§åé¦ äº¬ICPè¯030173å·
返回页面的所有代码