Python3之爬虫中回调函数的简单应用

最新推荐文章于 2023-09-26 09:09:44 发布

Quincy379

最新推荐文章于 2023-09-26 09:09:44 发布

阅读量1.6k

点赞数

分类专栏： Python 文章标签：爬虫应用函数 python

本文链接：https://blog.csdn.net/qq_33733970/article/details/77678870

版权

Python 专栏收录该内容

271 篇文章 9 订阅

订阅专栏

import re
from multiprocessing import Pool

import requests


'''
<a href="/films/344264" title="战狼2" data-act="boarditem-click" data-val="{movieId:344264}">战狼2</a>'''
movie_pattern = re.compile(r'}">(.*?)</a></p>\n<p class="star">(.*?)</p>')


def get_page(url):
    res = requests.get(url).text
    return {'url': url, 'res': res}


def deal_data(res):
    print(res['url'], res['res'])
    movie_name = movie_pattern.findall(res['res'])
    with open('movie_info.txt', 'a', encoding='utf-8') as f:
        # print(movie_name)
        for item in movie_name:
            moviename, mainstar = item
            f.write('电影：%s，%s\n' % (moviename, mainstar))


if __name__ == '__main__':
    urls = [
        'http://maoyan.com/board/7',
        'http://maoyan.com/board/6',
        'http://maoyan.com/board/1',
        'http://maoyan.com/board/2',
        'http://maoyan.com/board/4',

    ]
    p = Pool(4)
    for url in urls:
        p.apply_async(get_page, args=(url,), callback=deal_data)

    p.close()
    p.join()

Quincy379

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python3之爬虫中回调函数的简单应用

import refrom multiprocessing import Poolimport requests'''<a href="/films/344264" title="战狼2" data-act="boarditem-click" data-val="{movieId:344264}">战狼2</a>'''movie_pattern = re.compile(r'}">(.*?)
复制链接

扫一扫

专栏目录