说明:仅供学习交流,严禁用于商业用途
整体思路
使用自己编写的python小程序,截取bibibili视频中up主的图片,每个视频中获取88张。
需要考虑视频弹幕关闭,最大化,自动播放,停止播放,换视频。
然后手动去除其中模糊/无人脸/错误的人脸等图片至50张。
目录说明
biliTest.py : 测试selenium 和 webdriver 是否配置正常
bilibili_autoplay.py : 主函数(运行此函数)
Utils.py :公共函数
video.txt : 爬取视频列表
配置说明
-
项目需要安装 selenium 的依赖 和 相应浏览器版本的 webdriver
-
video.txt 中是需要爬取视频链接,建议选取开箱类/读评论类视频并且时长大于5分钟(视频过程中只会出现改 up 主一个人)
-
运行之前修改 bilibili_autoplay.py 中的 save_img_path 为你想存放爬取的图片的路径
运行结果
每个文件夹下面都含有改视频的UP的88张照片
项目地址
github:https://github.com/larry6799/bilibil_image
gitee:https://gitee.com/larry6799/bilibili_image
参考资料
普通安装selenium和chrome driver: https://www.jianshu.com/p/dd848e40c7ad
anaconda下安装 selenium和chrome driver:https://blog.csdn.net/ykj942/article/details/85009700
人脸检测结果
使用insighface中的代码处理:
参考资料
普通安装selenium和chrome driver: https://www.jianshu.com/p/dd848e40c7ad
anaconda下安装 selenium和chrome driver:https://blog.csdn.net/larry1648637120/article/details/105811741