中国最好大学网络爬虫(无优化2024版)
中国最好大学网更新之后,排行的大学名字单独放进了和标签平级的里面,所以需要单独提取,而且由于输出时有空格,所以需要注意对字符串空格的去除。在做的过程中主要对列表的认识不够清晰,在追加时少加了【】,导致追加时“排行,名称,分数”变成了分开添加的,这是第一种错误。目前程序已经没有问题,但对于ulist列表的生命周期依旧存疑,问题:为什么该函数中的局部变量未经返回即可被其他函数调用?接着解析网页内容放入列表,for循环遍历提取子节点所有符合条件的标签,依次追加到ulist里面。




