#目标url:http://www.bayiyy.com/zuixin/
#爬取最新的300部片源(有电视剧有电影有动漫等等)
#这篇文章我会注释的详细一点,让刚入门的人容易看一点
import requests #请求http
from bs4 import BeautifulSoup #解析html
url = 'http://www.bayiyy.com/zuixin/' #目标url
urls = requests.get(url) #发送请求
urls.encoding = urls.apparent_encoding #转换编码
text = urls.text
soup = BeautifulSoup(text, 'html.parser') #使用html.parser解析器
#print(soup.prettify()) #试着显示html代码
#获取所有片源的URL
urlss = [] #空列表,用来保存获取到的所有片源url
for i in soup.find_all(class_="v_playBtn"): #遍历html网页中所有出现class="v_playBtn"属性的标签
urlss.append('http://www.bayiyy.com' + i.get('href')) #将他们保存到urlss空列表里
print('-'*16, end='');print('最新免费片源:TOP300', end='');print('-'*16)
print('-'*50)
for i,y in zip(soup.find_all('div', class_="v_txt"), urlss):
print('电影名:', end='')
print(i.get_text().strip())
print('片源:',y)
print('-'*50)
运行结果: