烦烦烦

最新推荐文章于 2022-08-18 19:54:02 发布

weixin_40846078

最新推荐文章于 2022-08-18 19:54:02 发布

阅读量114

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40846078/article/details/103603585

版权

# =第二题：获取数据（爬虫）（35分）==============================# %% ---------------------------------def getHtml(url): # （10分） ‘’‘子函数:获取网页内容。这里网页使用的是utf-8编码’’’

return “” # 注意修改这一句

print(len(getHtml(“http://www.pku.edu.cn”))) # 调用一下这个函数
# %% ---------------------------------

def getMuseums():  # （10分）    ‘’‘获取某一个省的博物馆信息       编程序从该省的页面中取得该省所有博物馆的相关信息       然后显示出来    ‘’’
    # ------ 先获取链接及网页内容（10分） ------    provName = ‘北京’  # 请务必改成你自己高中学籍所在的省）（留学生请用上海市）
    ‘’‘请打开网页        https://www.maigoo.com/goomai/197904.html       然后，在地图上点击打开你的省名所对应的网页，       为了节约时间，链接不用程序找，直接手工在地图上点击。       注：为了以防万一，如果上面网址不通，可以访问校内的备份的网页 http://cf.pku.edu.cn/tds/cfpy/material/museum/museum-beijing.html    ‘’’    # 请手工修改这个省的url网址    url = “https://www.maigoo.com/goomai/181042.html”

# ---- 下面进行解析、显示每所博物馆的名称及级别（15分） # 提示：你可以使用正则表达式，也可以用BeautifulSoup（后者可能会更方便一点）

weixin_40846078

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_40846078 CSDN认证博客专家 CSDN认证企业博客

码龄7年

3: 原创

122万+: 周排名

152万+: 总排名

266: 访问

: 等级

64: 积分

2: 粉丝

1: 获赞

16: 评论

0: 收藏

私信

关注

热门文章

最新评论

快
小豪666 回复 weixin_40846078: 那里有图？。。
快
小豪666: 评论长度有限制你看我这个吧。。。 http://note.youdao.com/noteshare?id=5bbd9c233769b8810fe363cdbfcf6102
快
小豪666: 第三题：统计信息第一部分 [code=python] #----------统计免费开放博物馆的个数（10分）----------#（注：免费开放博物馆信息是在倒数第二列） n1 = len(museums) n2 = 0 for l in museums: if l[4] == '是': n2 += 1 print('总有{}所博物馆，其中，免费开放博物馆有{}, 占{: 5.1f} %'.format(n1, n2, n2 / n1)) #-----------统计各省的博物馆数量（10分）------------#（提示：可使用dict字典） dic2= {} for l in museums: province = l[0] if province not in dic2: dic2[province] = 1 else: dic2[province] += 1 print('各省及对应的博物馆数', dic2) [/code]
快
weixin_40846078 回复小豪666: 发图给你了，火速第二题
快
小豪666: 第三题：统计信息第一部分 [code=python] def statistics(): museums = [['北京', '故宫博物院', '文物', '一级', '否', '北京市东城区景山前街4号'], ['北京', '中国国家博物馆', '文物', '一级', '是', '北京市东城区东长安街16号'], ['北京', '北京李大钊故居', '文物', '无级别','是', '北京市西城区文华胡同24号'], ['内蒙古', '新巴尔虎右旗巴尔虎博物馆（思歌腾博物馆）', '文物', '无级别', '是', '新巴尔虎右旗乌尔逊大街北段、克尔伦大街南段'], ['黑龙江', '泰来县博物馆', '文物', '无级别', '是', '泰来县湖滨路']] #----------统计免费开放博物馆的个数（10分）----------#（注：免费开放博物馆信息是在倒数第二列） n1 = len(museums) n2 = 0 for l in museums: if l[4] == '是': n2 += 1 print('总有{}所博物馆，其中，免费开放博物馆有{}, 占{: 5.1f} %'.format(n1, n2, n2 / n1)) #-----------统计各省的博物馆数量（10分）------------#（提示：可使用dict字典） dic2= {} for l in museums: province = l[0] if province not in dic2: dic2[province] = 1 else: dic2[province] += 1 print('各省及对应的博物馆数', dic2) [/code]

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。