Python安装
1、 版本2.7,直接百度上下载即可
2、 傻瓜式安装,记得勾选将python加入Path环境变量,不然一会儿还得手动配置
3、 安装成功,来个helloworld
Python代码
1、 爬获校花网的基本代码
import re
import requests
respose=requests.get('http://www.xiaohuar.com/v/')
# print(respose.status_code)# 响应的状态码
# print(respose.content) #返回字节信息
# print(respose.text) #返回文本内容
urls=re.findall(r'class="items".*?href="(.*?)"',respose.text,re.S) #re.S 把文本信息转换成1行匹配
url=urls[5]
result=requests.get(url)
img_url=re.findall(r'class="dropdown-menu".*?src="(.*?)"',result.text,re.S)[0]
image=requests.get(img_url)
with open('D:\\c.jpg','wb') as f:
f.write(image.content)
mp4_url=re.findall(r'id="media".*?src="(.*?)"',result.text,re.S)[0]
video=requests.get(mp4_url)
with open('D:\\Uknow.mp4','wb') as f:
f.write(video.content)
问题
Importrequests的时候,抛出异常
解决
Windows下进入cmd,cd python所在目录,并进到Scripts目录,直接通过pip installrequests命令安装第三方库requests即可,类似linux系统的自带源