python爬虫 爬取猫眼电影排行

1 爬取网站

猫眼: 点击跳转.

2 代码

import requests  
from bs4 import BeautifulSoup
import time
def get_one_page(url):  
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko)\
            Chrome/65.0.3325.162 Safari/537.36'  
    }

    response = requests.get(url, headers=headers)  
    if response.status_code == 200:  
        return response.text  
    return None  
def parse_one_page(soup):
    result = []
    for ul in soup.find_all(name='dd'):
        re = []
        re.append((ul.find(name='i').text))
        re.append((ul.find(name='p').text))
        re.append((ul.find(name='img', attrs='board-img').attrs['data-src']))
        re.append((ul.find(name='p', attrs='star').text))
        re.append((ul.find(name='p', attrs='releasetime').text))
        re.append((ul.find(name='p', attrs='score').text))
        result.append(re)
    return result
def main(offset):
    url = 'http://maoyan.com/board/4?offset=' + str(offset)  
    time.sleep(1)
    html = get_one_page(url)  
    soup = BeautifulSoup(html, 'lxml')
    return parse_one_page(soup)
print(main(10))

3 参考文献

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值