猫眼top100电影信息爬虫

代码如下
import requests
from requests.exceptions import RequestException
import re
def get_one_page(url):
try:
headers={‘User-Agent’:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36’}
response=requests.get(url,headers=headers)
if response.status_code==200:
return response.text
return None
except RequestException:
return None

def parse_one_page(html):
pattern=re.compile(’

. ?board-index-1">(\d+).?data-src="(. ?)".?/>. ?name"><a.?>(. ?)’+
'.
?star">(. ?)

.?releasetime">(. ?).?integer">(. ?).?fraction">(. ?).?’,re.S)
items=re.findall(pattern,html)
print(items)

def main():
url=‘http://maoyan.com/board/4?’
html=get_one_page(url)
parse_one_page(html)

if name==‘main’:
main()
显示结果如下
C:\Users\Administrator\python37\python.exe C:/Users/Administrator/PycharmProjects/Maoyantop100/spder.py
[(‘1’, ‘https://p1.meituan.net/movie/20803f59291c47e1e116c11963ce019e68711.jpg@160w_220h_1e_1c’, ‘霸王别姬’, '\n 主演:张国荣,张丰毅,巩俐\n ', ‘上映时间:1993-01-01’, ‘9.’, ‘5’)]

Process finished with exit code 0
一个页面是10个电影,为什么只能爬到第一信息,后面都没有呢,求指教

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值