Python爬虫爬取ok资源网电影播放地址

本文介绍了使用Python进行网络爬虫,通过XPath解析HTML,从OK资源网站上抓取电影播放地址的过程。内容涵盖Python基础、网络请求库的使用、XPath选择器的实践和爬虫策略的制定,对于初学者理解网页爬取具有指导意义。
摘要由CSDN通过智能技术生成
#爬取ok资源网电影播放地址

#www.okzy.co
#入口一:http://okzy.co/index.php?m=vod-search&wd={关键字}&submit=search
#入口二:http://www.okzy.co/?m=vod-type-id-{1-34}.html
#       http://www.okzy.co/?m=vod-index-pg-{1-1110}.html

# for x in range(1110):
# 	print("http://www.okzy.co/?m=vod-index-pg-{}.html".format(x))

#请求,响应,分析保存
#目标入口:首页->列表->子页面->内容(播放地址,对应名称)->保存(电影标题)

import requests
from lxml import etree
#表格模块
#pip install prettytable
from prettytable import PrettyTable

host = "http://www.okzy.co"
rooturl = "/?m=vod-index-pg-{}.html".format(1)

#请求入口页
response = requests.get(host+rooturl)
#输出页面内容-HTML
response.encoding = 'utf-8'
# print(response.text)
if response
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值