上期文章
数据分析案例
某公司有2份数据文件,现需要对其进行分析处理,计算每日的销售额并以柱状图表的形式进行展示
一月份数据是普通文本,使用逗号分割数据记录,从前到后分别是(日期,订单id,销售额,销售省份)
二月份是json数据,同样包含(日期,订单id,销售额,销售省份)
读取数据
class Record:
def __init__(self, data, order_id, money, province):
self.data = data
self.order_id = order_id
self.money = money
self.province = province
def __str__(self): # 对象变成字符串类型
return f'{self.data}, {self.order_id}, {self.money}, {self.province}'
import json
from data_define import Record
# 先定义一个抽象类用来做顶层设计,确定有哪些功能需要实现
class FileReader:
def read_data(self) -> list[Record]:
# 读取文件的数据,读到的每一条数据都转换为Record对象,将他们封装到list内返回
pass
class TextFileReader(FileReader):
def __init__(self, path):
self.path = path # 定义成员变量记录文件的路径
# 复写(实现抽象方法)父类的方法
def read_data(self) -> list[Record]:
f = open(self.path, 'r', encoding='UTF-8')
record_list: list[Record] = []
for line in f.readlines():
line = line.strip() # 消除读取到的每一行数据中的\n
data_list = line.split(',')
record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3]) # 字符串变数字
record_list.append(record)
f.close()
return record_list
class JsonFileReader(FileReader):
def __init__(self, path):
self.path = path # 定义成员变量记录文件的路径
# 复写(实现抽象方法)父类的方法
def read_data(self) -> list[Record]:
f = open(self.path, 'r', encoding='UTF-8')
record_list: list[Record] = []
for line in f.readlines():
data_dict = json.loads(line)
record = Record(data_dict['date'], data_dict['order_id'], int(data_dict['money']), data_dict['province'])
record_list.append(record)
f.close()
return record_list
if __name__ == '__main__':
text_file_reader = TextFileReader('2011年1月销售数据.txt')
json_file_reader = JsonFileReader('2011年2月销售数据JSON.txt')
list1 = text_file_reader.read_data()
list2 = json_file_reader.read_data()
for l in list1:
print(l)
from file_define import *
from data_define import *
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.globals import ThemeType
from pyecharts.faker import Faker
text_file_reader = TextFileReader('2011年1月销售数据.txt')
json_file_reader = JsonFileReader('2011年2月销售数据JSON.txt')
jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()
# 两个月份的数据合并为一个list存储
all_data: list[Record] = jan_data + feb_data
# 数据计算
data_dict = {}
for record in all_data:
if record.data in data_dict.keys():
data_dict[record.data] += record.money
else:
data_dict[record.data] = record.money
# 可视化图表开发
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))
bar.add_xaxis(list(data_dict.keys()))
bar.add_yaxis('销售额', list(data_dict.values()), label_opts=LabelOpts(is_show=True))
bar.set_global_opts(
title_opts=TitleOpts(title='每日销售额'),
datazoom_opts=DataZoomOpts()
)
bar.render('每日销售额.html')