观察,检验基本的数据。并将USDA的数据整合到一张大表中,方便后面的切块,聚合,图形化等工作
1. 观察并检验数据, 数据集一般都很多大,我们要先观察和检验一小部分数据,总结规律
db[0].keys() // 查看输入的json的所有keys
db[0]['nutrients'][0] // 查看第一条数据的nutrients字段的第一个值
pd.DataFrame(db[0]['nutrients'])[:7] //查看第一条数据的nutrients字段的前7个值
2. 将数据读入
- 入读食品数据 nutrients 是一个list类型,需要单独处理,这里要形成一个food的DataFrame,所有挑选有效的数据读入进来
info_keys = [“description”, “group”, “id”, “manufacturer”]
info = pd.DataFrame(db, columns=info_keys) - 读入nutrients数据,由于每个food的nutri