需求以及技术点梳理
爬取地址并保存在数据库,后期可放入网站后台调用,最终实现网站在线播放剧集
由于数据库以及后台相关知识尚未掌握
现暂时练习用爬虫爬取视频地址保存至excel,然后用access存储
利用人人视频爬取,因为它的视频url是现成的(不可思议噢)
先用selenium爬取,后期合适的话用scrapy全站爬取
保存用xlwt模块,后期练习操作excel,争取熟练使用此模块
爬取胜者即是正义为例
代码
#导入模块略
def main():
workbook = xlwt.Workbook(encoding='utf-8')
mysheet = workbook.add_sheet('剧集1')
mysheet.write(0, 0, '片名')
mysheet.write(0, 1, '集数')
mysheet.write(0,