爬虫简单程序（豆瓣top）

最新推荐文章于 2023-05-25 10:29:37 发布

Re_Dreamer

最新推荐文章于 2023-05-25 10:29:37 发布

阅读量283

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/kedat/article/details/121526012

版权

python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

import requests as r
import re

header = {
    # 伪装为ie浏览器
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36 Edg/95.0.1020.44'
}

url="https://movie.douban.com/top250"

response=r.get(url=url,headers=header)

# 排除杂项数据，仅提取名称
obj=re.compile(r'<span class="title">(?P<name>.*?)</span>.*?class="">',re.S)

result=obj.finditer(response.text)

for i in result:
    print(i.group("name"))

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Re_Dreamer

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫简单程序（豆瓣top）

import requests as rimport reheader = { # 伪装为ie浏览器 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36 Edg/95.0.1020.44'}url="https://movie.douban.com/top250"resp.
复制链接

扫一扫