按照教程配套资料给出的代码如下:
main2.py
from data_define import Record
from pymysql import Connection
f = open("d:/output.json", "w", encoding="UTF-8")
# 构建MySQL链接对象
conn = Connection(
host="localhost",
port=3306,
user="root",
password="123456",
autocommit=True
)
# 获得游标对象
cursor = conn.cursor()
# 选择数据库
conn.select_db("py_sql")
# 查询
cursor.execute("SELECT * FROM orders")
result = cursor.fetchall()
for r in result:
record = Record(r[0], r[1], r[2], r[3])
f.write(record.to_json())
f.write("\n")
# 关闭MySQL链接对象
conn.close()
f.close()
data_define.py
"""
数据定义的类
"""
class Record:
def __init__(self, date, order_id, money, province):
self.date = date # 订单日期
self.order_id = order_id # 订单ID
self.money = money # 订单金额
self.province = province # 销售省份
def __str__(self):
return f"{self.date}, {self.order_id}, {self.money}, {self.province}"
def to_json(self):
d = {"date": self.date, "order_id": self.order_id, "money": self.money, "province": self.province}
import json
return json.dumps(d)
file_define.py
"""
和文件相关的类定义
"""
import json
from data_define import Record
# 先定义一个抽象类用来做顶层设计,确定有哪些功能需要实现
class FileReader:
def read_data(self) -> list[Record]:
"""读取文件的数据,读到的每一条数据都转换为Record对象,将它们都封装到list内返回即可"""
pass
class TextFileReader(FileReader):
def __init__(self, path):
self.path = path # 定义成员变量记录文件的路径
# 复写(实现抽象方法)父类的方法
def read_data(self) -> list[Record]:
f = open(self.path, "r", encoding="UTF-8")
record_list: list[Record] = []
for line in f.readlines():
line = line.strip() # 消除读取到的每一行数据中的\n
data_list = line.split(",")
record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])
record_list.append(record)
f.close()
return record_list
class JsonFileReader(FileReader):
def __init__(self, path):
self.path = path # 定义成员变量记录文件的路径
def read_data(self) -> list[Record]:
f = open(self.path, "r", encoding="UTF-8")
record_list: list[Record] = []
for line in f.readlines():
data_dict = json.loads(line)
record = Record(data_dict["date"], data_dict["order_id"], int(data_dict["money"]), data_dict["province"])
record_list.append(record)
f.close()
return record_list
if __name__ == '__main__':
text_file_reader = TextFileReader("D:/2011年1月销售数据.txt")
json_file_reader = JsonFileReader("D:/2011年2月销售数据JSON.txt")
list1 = text_file_reader.read_data()
list2 = json_file_reader.read_data()
for l in list1:
print(l)
for l in list2:
print(l)
运行结果后会出现错误:raise TypeError(f'Object of type {o.__class__.__name__} '
TypeError: Object of type date is not JSON serializable 如下图所示:
错误分析:是因为 date
对象默认情况下不能直接序列化为 JSON 字符串。为了解决这个问题,需要在日期对象的地方进行转换,将其转换为字符串形式。
解决办法:定义一个 DateEncoder
类,用于处理日期类型。然后,在 to_json
方法中,将日期字段转换为字符串形式。最后,在循环中,使用 Record(*row).to_json()
来创建一个包含所有记录的 JSON 列表,并将其写入文件中。这样,日期字段将被正确序列化为 JSON 格式。
只需要在data_define.py修改和添加一部分代码即可成功,修改后的代码如下所示:
from datetime import date
import json
class DateEncoder(json.JSONEncoder):
def default(self, obj):
if isinstance(obj, date):
return obj.isoformat()
return super().default(obj)
class Record:
def __init__(self, date, order_id, money, province):
self.date = date # 订单日期
self.order_id = order_id # 订单ID
self.money = money # 订单金额
self.province = province # 销售省份
def __str__(self):
return f"{self.date}, {self.order_id}, {self.money}, {self.province}"
def to_json(self):
d = {"date": self.date, "order_id": self.order_id, "money": self.money, "province": self.province}
return json.dumps(d, ensure_ascii=False, cls=DateEncoder)
其中DateEncoder
类定义了一个自定义的JSON编码器类,它继承自json.JSONEncoder
。JSON编码器的作用是将Python对象转换为JSON格式的字符串。
在这个自定义编码器中,有一个名为default
的方法。default
方法是一个特殊的方法,它会在JSON编码器遇到无法直接序列化的对象时被调用。
在这里,default
方法首先检查传递给它的对象obj
是否是date
类型的实例。如果是,它使用isoformat()
方法将日期对象转换为ISO 8601格式的字符串表示。ISO 8601是一种常见的日期和时间表示法,例如:"2023-09-27"代表日期。
如果obj
不是date
类型的实例,default
方法调用super().default(obj)
来使用json.JSONEncoder
的默认行为来处理对象。这样可以确保其他类型的对象也能正确序列化。
最后,通过定义这个自定义的JSON编码器,您可以在使用json.dumps
函数时通过cls
参数指定这个编码器,以便在将日期对象转换为JSON字符串时使用自定义的日期格式。
总之,这段代码的作用是为了在JSON序列化过程中将date
对象转换为可读性良好的日期字符串格式。