支持平台
爬虫环境
- 需要安装nodejs
本人安装的nodejs环境如下
- python3环境安装(本人是mac,直接brew安装,windows环境自行解决哈)
爬虫运行
运行命令:python3 extract.py
这里本人做过改造,改造为爬取快手列表页的视频地址:
while True:
urlOri = input("输入列表页链接):")
#如果将这里的判断去掉,则直接获取单个视频
if urlOri.__contains__('http'):
#直接输入http连接的列表页面
what = ks.craw(urlOri)
else :
#获取本地文件,快手目前分页有点问题,可以通过手动下拉页面后,将页面保存为源文件,本地解析