关于“淘宝爆款”的数据抓取与数据分析

本文为younghz原创,文章链接为:http://blog.csdn.net/u012150179/article/details/37306629


这个问题最初是源于我在知乎上一个回答(http://www.zhihu.com/question/24368542/answer/27579662),涉及了两个方面:数据抓取和数据分析。


1、数据爬取

爬取对象:淘宝“连衣裙 夏”的搜索结果。爬取对象的选择分析我在文章中也有提及。

工具:Scrapy。

代码:我把当时实现的代码放在了GitHub上,地址:https://github.com/younghz/TBBKAnalysis,感兴趣的可以看一下。关于Scrapy的知识与爬虫的编写可以见专栏:http://blog.csdn.net/column/details/younghz-scrapy.html


2、数据分析

分析内容可见上述Repository的Wiki(https://github.com/younghz/TBBKAnalysis/wiki)。我也会将其写在下面。或者直接看上面知乎问题中我写的答案。

工具:ipython & matplotlib。


3、分析内容

分析内容放在了Wiki中,链接:https://github.com/younghz/TBBKAnalysis/wiki。或者直接见下面正文。(注意:如果Wiki中图片无法打开,请使用较高版本的Chrome浏览器。)


4、正文

一、案例选择。

现在着手分析的对象是能让你在三个月获得大把钞票的“爆款”。这 当然得拿最有代表性的商品当例子,最有代表性就是最火的。看看什么最火。下面是淘宝指数(http://shu.taobao.com/top/16/search)数据。 

  • 5
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值