接着上一篇文章,通过python产生了模拟消费数据后,同时使用pymysql实现了大批小文件导入了数据库mysql。具体见上一篇文章:peter.cao:python大数据实践之一:导入大批数据文件到mysqlzhuanlan.zhihu.com
既然是消费数据,就需要对数据展开分析了,数据样例如下:
其中第一列为日期,第二列为时间,第三列为商品名,第四列为销售金额。接下来可以就几个方面进行统计分析,包括:(1)统计每日消费总收入;(2)统计每日销售商品总金额;(3)统计所有商品销售收入;(4)统计每日分时段销售情况。
任务一:统计每日消费总收入
思路:就是对每日所有商品销售金额相加,然后按日期分组
sql语句:
sql_daily_money_sum = "select date, sum(money) as dailyMoney from goods group by date"
然后使用pymysql客户端执行查询操作,返回数据为元组形式,直接拆分保存即可:
IncomeStatByDay = ex01.exeQuery(sql=sql_daily_money_sum) #执行查询语句
DateList=[item[0] for item in IncomeStatByDay] #日期列
DateIncomeList=[item[1] for item in IncomeStatByDay] #收入列