刘先生经营着一家销售电脑及周边耗材的淘宝店铺。半年下来,来自全国各地的淘宝买家,在刘先生这里下了不少订单,销售额看起来非常不错。但是让刘先生苦恼的是,随着订单的增多,淘宝后台的数据量也越来越多。什么买家数据、商品数据、交易数据等等,让刘先生看得头昏眼花。
刘先生只想知道,如何分析这些数据,让淘宝店铺的销量越多越好。
好,上面就是刘先生的需求:线上淘宝店铺的销量数据分析。
接下来,我们将使用Python中的Pandas数据分析工具,一步一步帮助刘先生解决他的苦恼。
Pandas是什么?
Pandas是使用Python编程语言编写的软件库,用于数据处理和分析。特别是,它提供了用于操作数值表和时间序列的数据结构。更多有关Pandas的介绍,请点击这里。
刘先生为我们提供了从淘宝后台下载的各种数据文件(数据内容纯属虚构,如有雷同实属巧合),如下表所示。
No | 文件名 | 概要 |
1 | customer_master.csv | 淘宝买家数据。如姓名、性别等。 |
2 | item_master.csv | 店铺商品数据。如商品名、商品单价等。 |
3 | transaction_1.csv | 交易概要数据。 |
4 | transaction_2.csv | 交易概要数据。由于数据量过大,分成了两个文件。 |
5 | transaction_detail_1.csv | 交易详细数据。 |
6 | transaction_detail_2.csv | 交易详细数据。由于数据量过大,分成了两个文件。 |
整个操作流程如下图所示:
接下来,我们就从这些数据文件入手,进行第一步“整体观察”,理解数据的大致轮廓。
此处为语雀文档,点击链接查看:https://www.yuque.com/codeclub/yvmeco/friz9v