Python 课堂小作业top250

最新推荐文章于 2024-01-17 06:54:50 发布

白云胖揍王小明

最新推荐文章于 2024-01-17 06:54:50 发布

阅读量143

点赞数

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52436400/article/details/130582499

版权

import urllib.request
 
 
def get_html_text(url):
    try:
        h = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '
                           'AppleWebKit/537.36 (KHTML, like Gecko) '
                           'Chrome/68.0.3440.106 Safari/537.36'
             }
        r = requests.get(url, headers=h, timeout=3000)
        r.raise_for_status()   # 如果不是200，则引发HTTPError异常
        r.encoding = r.apparent_encoding  # 根据内容去确定编码格式
        return r.text
    except BaseException as e:
        print("出现异常：", e)
        return str(e)
 
 
#  将字符串写进文件中，参数分别是文件名和内容
def writefile(file_name, content_str):
    with open(file_name, "w", encoding='utf-8', ) as f:
        f.write(content_str)
        f.close
 
 
#  爬虫代码
import requests
import re
from bs4 import BeautifulSoup
print("开始爬虫")
url = "https://movie.douban.com/top250"
html_text = get_html_text(url)
#writefile("a.txt", html_text)
soup = BeautifulSoup(html_text,"html.parser")
nodes=soup.find_all("span",class_="title")
nodes2=soup.find_all("span",class_="rating_num")
nodes3 = soup.find_all("img")
for i in nodes:
    s = i.string
    if s[1]=='/':
        continue
    else:
        print(i.string)
 
for j in nodes2:
    print(j.string)
for k in nodes3:
    link = k["src"]
    name = k["alt"]
 
    print(name)
    print(link)
    urllib.request.urlretrieve(link,"C:/Users/416/Desktop/pics/%s.jpg" % name)

白云胖揍王小明

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

白云胖揍王小明 CSDN认证博客专家 CSDN认证企业博客

码龄4年

9: 原创

122万+: 周排名

167万+: 总排名

9757: 访问

: 等级

117: 积分

2: 粉丝

6: 获赞

3: 评论

24: 收藏

私信

关注

热门文章

分类专栏

笔记 1篇

最新评论

Python词云wordcloud
CSDN-Ada助手: 恭喜您写了第9篇博客，介绍的Python词云wordcloud非常有用！希望您能继续保持创作的热情，并在未来的博客中分享更多有趣的Python技巧和应用。对于下一步的创作建议，或许可以考虑介绍一些Python图像处理相关的内容，如图像识别、图像增强等，这些都是非常实用的技能。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
机器人学P60例2-7代码
CSDN-Ada助手: 非常感谢您的第四篇博客，题目为“机器人学P60例2-7代码”，读了您的博客，我学到了很多关于机器人学的知识。我想祝贺您持续创作，您的博客对于很多人都是非常有用的。我期待您的下一篇博客，希望您能够分享更多的机器人学知识，并给出更加深入的分析。谢谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
为什么栈空判断是top为-1而不是0？
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。