使用Selenium爬取b站Up主照片,用作个人人脸识别学习使用

说明:仅供学习交流,严禁用于商业用途

整体思路

使用自己编写的python小程序,截取bibibili视频中up主的图片,每个视频中获取88张。
需要考虑视频弹幕关闭,最大化,自动播放,停止播放,换视频。
然后手动去除其中模糊/无人脸/错误的人脸等图片至50张。

目录说明

在这里插入图片描述

biliTest.py : 测试selenium 和 webdriver 是否配置正常

bilibili_autoplay.py : 主函数(运行此函数)

Utils.py :公共函数

video.txt : 爬取视频列表

配置说明
  • 项目需要安装 selenium 的依赖 和 相应浏览器版本的 webdriver

  • video.txt 中是需要爬取视频链接,建议选取开箱类/读评论类视频并且时长大于5分钟(视频过程中只会出现改 up 主一个人)

  • 运行之前修改 bilibili_autoplay.py 中的 save_img_path 为你想存放爬取的图片的路径

运行结果

在这里插入图片描述

每个文件夹下面都含有改视频的UP的88张照片

在这里插入图片描述

项目地址
github:https://github.com/larry6799/bilibil_image
gitee:https://gitee.com/larry6799/bilibili_image
参考资料

普通安装selenium和chrome driver: https://www.jianshu.com/p/dd848e40c7ad

anaconda下安装 selenium和chrome driver:https://blog.csdn.net/ykj942/article/details/85009700

人脸检测结果

使用insighface中的代码处理:

在这里插入图片描述

参考资料

普通安装selenium和chrome driver: https://www.jianshu.com/p/dd848e40c7ad

anaconda下安装 selenium和chrome driver:https://blog.csdn.net/larry1648637120/article/details/105811741

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值