![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
larry6799
西安电子科技大学
展开
-
使用Selenium爬取b站Up主照片,用作个人人脸识别学习使用
说明:仅供学习交流,严禁用于商业用途整体思路使用自己编写的python小程序,截取bibibili视频中up主的图片,每个视频中获取88张。需要考虑视频弹幕关闭,最大化,自动播放,停止播放,换视频。然后手动去除其中模糊/无人脸/错误的人脸等图片至50张。目录说明biliTest.py : 测试selenium 和 webdriver 是否配置正常bilibili_autoplay.py : 主函数(运行此函数)Utils.py :公共函数video.txt : 爬取视频列表配置.原创 2020-06-24 02:12:02 · 558 阅读 · 0 评论 -
mac 已经安装anaconda,安装selenium和chromedrive
1. 安装 selenium打开terminalconda install selenium选择 yes 安装完成(会顺便更新一下conda)2. 安装 chromedrive2.1 查看Chrome版本在chrome浏览器地址栏输入 chrome://version/我这里显示的是Google Chrome 81.0.4044.122(正式版本)...原创 2020-04-28 13:45:14 · 930 阅读 · 0 评论 -
爬取西安电子科技大学教师主页的所所有教师邮箱 (使用java的jsoup)
1. 简介为了爬取西电的教师主页信息,我选取了旧版教师主页,旧版教师主页的较新版教师主页的比较稳定,并且老师更新的信息更为详细了。此次利用的是Jsoup: Jsoup 中文文档2.基本思路通过主页拿到学院URL-->各学院的老师URL -->所有老师页面的邮箱信息3.代码import java.io.IOException;import java.uti...原创 2019-12-02 19:11:40 · 3429 阅读 · 1 评论