加载json数据
data = json.load(open('data/foods-2011-10-03.json'))
data
大概观察一下数据的结构,是由多个字典形式的数据组成
data[0].keys()
查看数据含有的字段名
然后将数据转换为DataFrame格式
df = pd.DataFrame(data)
df
现在我们可以比较清楚的看到数据的结构,主要的数据有食物品类、组成成分、id标识、生产厂商、营养物、份数、标签
这里面我们需要的数据主要是食物品类、组成成分、id标识、营养物
营养物这一列又是一个个字典组成,所以我们需要单独处理
从原始json数据值展开营养物数据,组成一个新的DataFrame,并给每一个数据添加对应的id标识。
nutrients = []
for rec in data:
nutrient = pd.DataFrame(rec['nutrients'])
nutrient['id'] = rec[&