关于“淘宝爆款”的数据抓取与数据分析

最新推荐文章于 2024-08-09 10:04:21 发布

置顶

young-hz

最新推荐文章于 2024-08-09 10:04:21 发布

阅读量2.9w

点赞数 5

分类专栏： Scrapy Scrapy 文章标签：数据分析数据挖掘淘宝爆款 Scrapy python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012150179/article/details/37306629

版权

本文利用Scrapy爬虫抓取淘宝"连衣裙夏"的销量数据，通过数据分析发现销量呈指数下降趋势，价格主要集中在50元以下。卖家主要分布在广东、浙江等地，天猫店铺比例稳定。对关键词喜好度的分析揭示了消费者的地域特点。

摘要由CSDN通过智能技术生成

本文为younghz原创，文章链接为：http://blog.csdn.net/u012150179/article/details/37306629

这个问题最初是源于我在知乎上一个回答（http://www.zhihu.com/question/24368542/answer/27579662），涉及了两个方面：数据抓取和数据分析。

1、数据爬取

爬取对象：淘宝“连衣裙夏”的搜索结果。爬取对象的选择分析我在文章中也有提及。

工具：Scrapy。

代码：我把当时实现的代码放在了GitHub上，地址：https://github.com/younghz/TBBKAnalysis，感兴趣的可以看一下。关于Scrapy的知识与爬虫的编写可以见专栏：http://blog.csdn.net/column/details/younghz-scrapy.html

2、数据分析

分析内容可见上述Repository的Wiki（https://github.com/younghz/TBBKAnalysis/wiki）。我也会将其写在下面。或者直接看上面知乎问题中我写的答案。

工具：ipython & matplotlib。

3、分析内容

分析内容放在了Wiki中，链接：https://github.com/younghz/TBBKAnalysis/wiki。或者直接见下面正文。（注意：如果Wiki中图片无法打开，请使用较高版本的Chrome浏览器。）

4、正文

一、案例选择。

现在着手分析的对象是能让你在三个月获得大把钞票的“爆款”。这当然得拿最有代表性的商品当例子，最有代表性就是最火的。看看什么最火。下面是淘宝指数（http://shu.taobao.com/top/16/search）数据。

最低0.47元/天解锁文章

关注

5
点赞
踩
30

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。