懒人听书爬虫(爬到了音频地址,却总是失效,却不成功)

叹服人家的加密做的成功!


from lxml import etree
from time import sleep
import requests
import json
import re
from selenium import webdriver
from time import sleep
import datetime
import tkinter as tk 

def function():
	pass

def function2():
	pass

def main():
	headers = {
	'ser-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
	}
	url = 'https://www.lrts.me/book/39319'
	num = url.split('/')[-1]
	url_true = 'https://www.lrts.me/ajax/playlist/2/{}/1'.format(num)


	res = requests.get(url=url_true,headers=headers)
	# print(res.text)
	time.sleep(2)

	pat = r'id="section(.*?)"'
	mp3_ids = re.compile(pat).findall(res.text) 
	# print(result)
	for mp3_id in mp3_ids:
		mp3_html = 'https://www.lrts.me/ajax/path/4/39319/{}'.format(mp3_id)
		print(mp3_html)
		mp3_res = requests.get(url=mp3_html,headers=headers)
		# print(mp3_res.text)
		time.sleep(2)
		data = mp3_res.json()
		print(data)
		# json_dict = json.loads(mp3_res.text)
		# mp3_url = json_dict['data']
		# print(mp3_url)		
		print('*'*50)


if __name__ == '__main__':
	main()

 


评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

最懂编程的医生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值