项目01商铺数据加载及存储
1.项目说明
读取商铺数据文件,并对数据进行解析和清洗,并将结果储存
2.项目具体要求
- 成功读取“商铺数据.csv”文件
- 解析数据,存成列表字典格式:[{‘var1’:value1,’var2’:value2,’var3’:values,…},…,{}]
- 数据清洗:① comment,price两个字段清洗成数字② 清除字段缺失的数据 ③ commentlist拆分成三个字段,并且清洗成数字
- 结果存为.pkl文件
3.实现思路:
- 1.使用open语句读取数据,使用for循环语句对每一行进行解析和清洗,并存储成[[”]]格式,
- 2.使用dict()函数将数据转换成列表字典格式,存入列表中,直到循环结束,得到全部成功解析和清洗的数据。
- 3.使用pickle.dump()函数将数据存储成pkl文件
4.实现过程:
1.数据读取:
f = open('C:/Users/Hjx/Desktop/商铺数据.csv','r',encoding='utf8')
for i in f.readlines()[:5]:
print(i.split(','))
说明:第一步使用open语句读取商铺数据,然后查看前5条数据
2.创建comment、price、commentlist清洗函数
def fcm