爬取快手视频

爬取快手视频

Pycharm

#思路:
#1:找到快手视频对应网址,按下F12打开开发者工具
在这里插入图片描述
#2:找到开发工具下的网络,媒体
在这里插入图片描述
#该内容下的url地址
https://v2.kwaicdn.com/upic/2023/09/04/16/BMjAyMzA5MDQxNjU0NTBfMTgyMjg1MDk2OF8xMTIxMDMyMjkzNzlfMV8z_b_B215548d220a9056e2d01c0863fc360c8.mp4?pkey=AAX4C1BmyjhTI-oAeP1L3u38yDhG-Jk4XCtz2qFfhMJOQn7W1MvlNVsQ4Km4q4nVDBpWcy4nGn-hdOY9k_YAyKhm4F_pQYTEzNeNtGTlz42fbOrJ3YZFa8DduSvO6N7KC1w&tag=1-1697811107-unknown-0-yysvzfukda-0c70c8cab82bc12f&clientCacheKey=3xn4aag73j3cy5e_b.mp4&di=JA4Ec24gFmDM0iRWa3_Umw==&bp=10004&tt=b&ss=vp



#3:首先导入模块,将代码想象为将网址保存到url变量,通过python使用第三方库requests将文件资源保存到res。
import requests
url = "https://v2.kwaicdn.com/ksc2/F7WkO6AhOQQbkCYawV13xfaHK38Njuu_Hpz6DRe1GlHh99111qbEWSemqaoCfF68vApjXNTaaa-HrPI6VdzB9mbJf29vFlOA3UiQCoHIXXmQYpCS1dndA71IbJJDj7wTbv82KrXpUqudIk2VjY8im0QIFk5pB5AzwVIwfYhIa3ct4ZHGAqpV9dsn0pKwmzvZ.mp4?pkey=AAXdc91tCCiguHYBBctrimwj5BM2xG17ZKBgmSEmTC9gPriHhRu3Rb7MhNcmkhsI0RWxS7SVxEfFaXKmURyZ4vSqpOZxqqg_3O-muZfbCUiYqBHRVdQBnsizr-KWAjzGcl8&tag=1-1697813348-unknown-0-umb8d4lryv-55e23a9143709559&clientCacheKey=3xdv46hyu4856ik_bF.mp4&di=JA4Ec24gFmDM0iRWa3_Umw==&bp=10004&tt=b&ss=vp"

res = requests.get(url)

#4打印响应码判定是否通讯成功
print(res.status_code)
#5打开空文件,并将视频文件写入
open("家和万事兴","wb").write(res.content)
Selenium是一个流行的自动化测试工具,也可以用于网页爬虫,因为它能够模拟用户操作浏览器,包括点击、滚动、填写表单等。要在Selenium中爬取快手视频,你需要遵循以下步骤: 1. **安装库**:首先,确保已经安装了Python的Selenium库以及对应的WebDriver(比如ChromeDriver、FirefoxDriver等)。可以使用pip命令进行安装: ``` pip install selenium webdriver_manager ``` 2. **下载WebDriver**:前往对应浏览器的Driver官网下载适合你的浏览器版本的WebDriver。 3. **配置浏览器**:创建一个新的浏览器实例,指定WebDriver的位置: ```python from selenium import webdriver driver = webdriver.Chrome(executable_path='path/to/chromedriver') ``` 4. **打开快手网站**: ```python driver.get('https://www.kuaishou.com/') ``` 5. **找到视频元素**:通常,快手视频位于HTML页面中的某个特定class或id下,你可以通过CSS选择器或XPath定位到这个元素: ```python video_element = driver.find_element_by_css_selector('.video-player') # 根据实际HTML结构修改CSS选择器 ``` 6. **获取视频信息**:利用`video_element`获取视频标题、链接或其他相关信息,这可能需要查看快手的HTML源码并确定正确的属性。 7. **处理动态加载**:如果视频数据是通过JavaScript动态加载的,你可能需要等待页面完全加载或者使用如`time.sleep()`或`WebDriverWait`等待特定元素出现。 8. **保存或分析数据**:提取到所需数据后,可以选择将它们保存到文件或直接进行后续处理。 9. **结束会话**: ```python driver.quit() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

顿感小鹿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值