- 博客(1)
- 收藏
- 关注
原创 爬取了豆瓣11W+网页,获取了5W+有效书籍信息
爬取了豆瓣11W+网页,获取了5W+有效书籍信息标签:爬虫 Python之前写了一篇博文:利用爬虫获取豆瓣上可能喜欢的书籍,这篇博文中的爬虫可以以给定的url为原点,慢慢的向外扩散爬取书籍信息,可以获取到自己可能喜欢的书籍,但是有一个大缺点,就是只能提供一个初始url,即以一本书为基础进行推荐,而不能针对一个用户喜欢的所有书籍进行推荐。后来想了想,可以把所有的书籍信息爬取下来,然后根据推荐算法推荐书
2016-05-15 16:24:20 8659 11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人