爬虫
文章平均质量分 96
moverzp
这个作者很懒,什么都没留下…
展开
-
利用爬虫获取豆瓣上可能喜欢的书籍
利用爬虫获取豆瓣上可能喜欢的书籍标签: 爬虫 Python1.目标博主比较喜欢看书,购物车里面会放许多书,然后等打折的时候开个大招。然而会遇到一个问题,就是不知道什么书是好书,不知道一本书到底好不好,所以常常会去豆瓣读书看看有什么好书推荐,不过这样效率比较低。最近学习了爬虫的基础知识,有点手痒,故写一个爬取豆瓣推荐书籍的爬虫,和大家分享一下。我们给爬虫设置一个起始url,然后爬取豆瓣在该url推荐的原创 2016-04-05 21:39:01 · 10022 阅读 · 0 评论 -
爬取了豆瓣11W+网页,获取了5W+有效书籍信息
爬取了豆瓣11W+网页,获取了5W+有效书籍信息标签:爬虫 Python之前写了一篇博文:利用爬虫获取豆瓣上可能喜欢的书籍,这篇博文中的爬虫可以以给定的url为原点,慢慢的向外扩散爬取书籍信息,可以获取到自己可能喜欢的书籍,但是有一个大缺点,就是只能提供一个初始url,即以一本书为基础进行推荐,而不能针对一个用户喜欢的所有书籍进行推荐。后来想了想,可以把所有的书籍信息爬取下来,然后根据推荐算法推荐书原创 2016-05-15 16:24:20 · 8661 阅读 · 11 评论 -
基于物品的协同过滤算法:理论说明,代码实现及应用
基于物品的协同过滤算法:理论说明,代码实现及应用标签: 爬虫 Python主要参考资料: 项亮. 推荐系统实践[M]. 北京:人民邮电出版社, 2012.转载请注明出处:sss0.一些碎碎念从4月中旬开始,被导师赶到北京的郊区搬砖去了,根本就没有时间学习看书,这个时候才知道之前的生活是多么的幸福:每天看自己想看的书,然后实践一下,最后写博文总结一下,偶尔还能去跑个步,游个泳。想找实习的计划也泡汤了原创 2016-07-04 20:25:50 · 34265 阅读 · 3 评论