起点的排序眼花缭乱,什么点击量,收藏量,月票量什么的,唯独没有按评分的排序。我觉得挺奇怪的,评分是个很值得参考的标准,起点居然不做???既然他不做,那我自己做吧。
大体思路:先写个爬虫把书籍信息爬下来,然后再进行我想要的排列
爬虫:
这是我准备爬的页面,我要爬去书名+url+评分。前两个是静态的,没什么问题,而评分就就比较麻烦,要点进去,关键还不是静态的。先看看源代码:
这评分居然不是一个数,而是两个数加权后放一起的,当时一看这个就感觉不会是静态。
再查看这个网页最初始的源代码:
起点的排序眼花缭乱,什么点击量,收藏量,月票量什么的,唯独没有按评分的排序。我觉得挺奇怪的,评分是个很值得参考的标准,起点居然不做???既然他不做,那我自己做吧。
大体思路:先写个爬虫把书籍信息爬下来,然后再进行我想要的排列
爬虫:
这是我准备爬的页面,我要爬去书名+url+评分。前两个是静态的,没什么问题,而评分就就比较麻烦,要点进去,关键还不是静态的。先看看源代码:
这评分居然不是一个数,而是两个数加权后放一起的,当时一看这个就感觉不会是静态。
再查看这个网页最初始的源代码: