第5关：爬取单页多个div标签的信息

最新推荐文章于 2023-11-02 16:57:08 发布

小锐->技术成就梦想,梦想成就辉煌。

最新推荐文章于 2023-11-02 16:57:08 发布

阅读量1.6k

点赞数 1

分类专栏： python 文章标签： python 网络爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_56636204/article/details/127683797

版权

python 专栏收录该内容

64 篇文章 55 订阅

订阅专栏

任务描述

本关任务：改进上一关的代码。爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。湖南大学讲座信息的网址为学术活动-湖南大学

相关知识

find_all函数通过BeautifulSoup的find_all(name，attr)方法，可以找到符合条件的多个标签，将多个标签的内容返回为一个列表 lb=bg.find_all("div",class="xinwen-wen") 找到网页的所有class属性为xinwen-wen的div标签，存入列表lb

列表的操作对于得到的多个标签的列表，使用for循环，可以依次访问每个标签，使用find函数找出其时间、标题和地点的文本，加入到列表，再加入二维列表jzxx中。

编程要求

根据提示，在右侧编辑器补充代码，爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。

开始你的任务吧，祝你成功！

import requests

from bs4 import BeautifulSoup

url = 'https://www.hnu.edu.cn/xysh/xshd.htm'

r = requests.get(url)

r.encoding = 'utf-8'

jzxx=[]

#代码开始

soup = BeautifulSoup(r.text, "html.parser")

lb = soup.find_all("div", class_="xinwen-wen")

for i in lb:

    jzsj = i.find("div", class_= "xinwen-sj-top").text.strip()

    jzbt = i.find("div", class_= "xinwen-wen-bt").text.strip()

    jzdd = i.find("div", class_= "xinwen-wen-zy").text.strip()

    jzxx.append([jzsj,jzbt,jzdd])



#代码结束

f1=open("jzxx2.txt","w")

for xx in jzxx:

    f1.write(",".join(xx)+"\n")

f1.close()

小锐->技术成就梦想,梦想成就辉煌。

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
第5关：爬取单页多个div标签的信息

列表的操作对于得到的多个标签的列表，使用for循环，可以依次访问每个标签，使用find函数找出其时间、标题和地点的文本，加入到列表，再加入二维列表jzxx中。find_all函数通过BeautifulSoup的find_all(name，attr)方法，可以找到符合条件的多个标签，将多个标签的内容返回为一个列表。爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。根据提示，在右侧编辑器补充代码，爬取湖南大学讲座网页的多个讲座信息，存储在二维列表jzxx中。开始你的任务吧，祝你成功！
复制链接

扫一扫

专栏目录

小锐->技术成就梦想,梦想成就辉煌。 CSDN认证博客专家 CSDN认证企业博客

码龄3年

110: 原创

2万+: 周排名

133万+: 总排名

13万+: 访问

: 等级

1290: 积分

1791: 粉丝

133: 获赞

21: 评论

556: 收藏

私信

关注

热门文章

分类专栏

最新评论

第1关：学习-Python文件之文本文件的顺序读写
wawa0611: 用空格分隔就行，不是冒号
educoder平台 python: 用字典实现单词识别
2301_77163980: 为什么我输入s，u输出Tuesday？
knn回归—高炉煤气发电（原始数据找作者领取）
qq_41229611: 求数据，谢谢！
随机森林温度预测项目实战
_Pershing: 博主可以提供数据吗
educoder:Python 计算思维训练——循环与列表（三）-＞第2关：计算原子能级
热破: 3.。。。。。。 def EnList(maxn): # 请在此添加实现代码 # # ********** Begin *********# me = 9.1094*10**-31 e=1.6022*10**-19 epsilon0 = 8.8542 * 10**-12 h = 6.6261 * 10**-34 print(' |能级1\t\t能级2\t\t能级3\t\t能级4\t\t能级5') print('-'*80) #80个"-"符号 for f in range(1, maxn + 1): print('{0} | '.format(f), end='') for i in range(1, 6): en = -(me*e**4)/(8*epsilon0**2*h**2) * (1/(i*i)-1/(f*f)) print('{0:E}\t'.format(en), end='') print() # ********** End **********#

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。