Python爬虫入门学习

最新推荐文章于 2024-07-28 15:46:11 发布

kinkin..

最新推荐文章于 2024-07-28 15:46:11 发布

阅读量47

点赞数 1

分类专栏： Python语言程序设计基础文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_45729831/article/details/121383588

版权

Python语言程序设计基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

抓取豆瓣电影Top250相关信息练习

import re
import requests

1. #获取网页
url = "https://movie.douban.com/top250"
head = {
    "User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Mobile Safari/537.36 Edg/95.0.1020.53"
}
resp = requests.get(url,headers=head)
html = resp.text
# print(html)

# 2. 解析数据
obj = re.compile(r'<li>.*?<div class="item">.*?<span class="title">(?P<title>.*?)</span>.*?'
                 r'<div class="bd">.*?<p class="">(?P<director>.*?)<br>(?P<year>.*?)'
                 r'&nbsp;/&nbsp;(?P<country>.*?)&nbsp;/&nbsp;(?P<type>.*?)</p>.*?'
                 r'<span>(?P<person>.*?)人评价</span>.*?<span class="inq">(?P<inq>.*?)</span>'
                 ,re.S
                 )

result = obj.finditer(html)
for i in result:
    print(i.group("title"))
    print(i.group("director").strip())
    print(i.group("year").strip())
    print(i.group("country"))
    print(i.group("type").strip())
    print(i.group("person")+"人评价")
    print(i.group("inq"))
    print("")

kinkin..

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫入门学习

参考2021年最新Python爬虫教程+实战项目案例（最新录制）_哔哩哔哩_bilibili抓取豆瓣电影Top250相关信息练习import reimport requests1. #获取网页url = "https://movie.douban.com/top250"head = { "User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, li
复制链接

扫一扫

专栏目录