先给大家看一下效果:
因为没有女朋友(懂的都懂),所以只能找一些女朋友的照片啦~
先获取一些漂亮女朋友照片
然后在根据照片进行颜值排名打分
来让我们看一下第一名的女朋友的颜值
第一名:颜值评分是94.69分的女朋友
最后一名:颜值评分是22.84分的女朋友
怎么感觉有点翻车,这个评分机制都点拉垮!
也可能是她的手挡住了脸,拉低的评分!
好!废话不多说,正式开始~
需要的环境与模块
[开发环境]:
- Python 3.8
- Pycharm 2021.2
- 会使用API接口 百度云接口
[模块使用]:
- requests
- tqdm
- os
- base64
模块安装问题:
-
如果安装python第三方模块:
1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
2. 在pycharm中点击Terminal(终端) 输入安装命令 -
安装失败原因:
- 失败一: pip 不是内部命令
解决方法: 设置环境变量 -
失败二: 出现大量报红 (read time out)
解决方法: 因为是网络链接超时, 需要切换镜像源
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
豆瓣:http://pypi.douban.com/simple/
例如:pip3 install -i https://pypi.doubanio.com/simple/ 模块名 -
失败三: cmd里面显示已经安装过了, 或者安装成功了, 但是在pycharm里面还是无法导入
解决方法: 可能安装了多个python版本 (anaconda 或者 python 安装一个即可) 卸载一个就好
或者你pycharm里面python解释器没有设置好
实现步骤
一. 数据来源分析
女盆友们照片, 照片url地址 可以从哪里获取
通过网页上面开发者工具进行抓包分析
二. 代码实现步骤 发送请求 >>> 获取数据 >>> 解析数据 >>> 保存数据
- 发送请求, 对于 https://www.**牙.com/g/2168 发送请求 列表页面
- 获取数据, 获取服务器返回的响应数据 response
- 解析数据, 提取我们想要数据内容 主播名字 主播封面图url地址
- json数据 可以直接处理
- re正则表达式提取
- 根据标签节点/属性提取内容:
- xpath
- css选择器
- 保存数据, 图片内容保存到本地文件夹
三.颜值检测
对于我们保存下来照片, 进行颜值检测评分
代码实现
# 导入数据请求
import requests # pip install requests (导入模块没有使用是灰色)
# 导入格式化输出模块
import pprint
# 导入os文件操作模块
import os
import base64
from tqdm import tqdm
# 发送请求
# 确定请求的url地址
for page in range(1, 11):
url = f&#