爬取剧集地址并存入excel

本文介绍了使用selenium爬取人人视频的剧集链接,以《胜者即是正义》为例,爬取后的链接暂存在Excel中,并探讨了后期可能用access存储和Scrapy进行全站爬取的可能性。作者还提到,爬取的链接存在时效性,可能需要定期更新。
摘要由CSDN通过智能技术生成

需求以及技术点梳理

爬取地址并保存在数据库,后期可放入网站后台调用,最终实现网站在线播放剧集

由于数据库以及后台相关知识尚未掌握

现暂时练习用爬虫爬取视频地址保存至excel,然后用access存储

利用人人视频爬取,因为它的视频url是现成的(不可思议噢)

先用selenium爬取,后期合适的话用scrapy全站爬取

保存用xlwt模块,后期练习操作excel,争取熟练使用此模块

爬取胜者即是正义为例

代码

#导入模块略
def main():
    workbook = xlwt.Workbook(encoding='utf-8')
    mysheet = workbook.add_sheet('剧集1')
    mysheet.write(0, 0, '片名')
    mysheet.write(0, 1, '集数')
    mysheet.write(0,
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值