晴若安
码龄8年
关注
提问 私信
  • 博客:1,003
    1,003
    总访问量
  • 1
    原创
  • 262,551
    排名
  • 4
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2017-02-01
博客简介:

qq_37434401的博客

查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    30
    当月
    1
个人成就
  • 获得5次点赞
  • 内容获得0次评论
  • 获得1次收藏
创作历程
  • 1篇
    2024年
成就勋章
兴趣领域 设置
  • 数据结构与算法
    算法
  • 人工智能
    机器学习深度学习神经网络自然语言处理图像处理数据分析
  • 音视频
    opencv语音识别计算机视觉
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

中国最好大学网络爬虫(无优化2024版)

中国最好大学网更新之后,排行的大学名字单独放进了和标签平级的里面,所以需要单独提取,而且由于输出时有空格,所以需要注意对字符串空格的去除。在做的过程中主要对列表的认识不够清晰,在追加时少加了【】,导致追加时“排行,名称,分数”变成了分开添加的,这是第一种错误。目前程序已经没有问题,但对于ulist列表的生命周期依旧存疑,问题:为什么该函数中的局部变量未经返回即可被其他函数调用?接着解析网页内容放入列表,for循环遍历提取子节点所有符合条件的标签,依次追加到ulist里面。
原创
发布博客 2024.08.05 ·
190 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏