数据分析实例 USDA 数据

本文介绍如何分析USDA数据,首先通过观察和检验数据总结规律,然后使用Pandas将数据读入并合并,创建一个大表,便于后续的切块、聚合和图形化操作。过程中注意数据去重和列名重命名。
摘要由CSDN通过智能技术生成

观察,检验基本的数据。并将USDA的数据整合到一张大表中,方便后面的切块,聚合,图形化等工作

1. 观察并检验数据, 数据集一般都很多大,我们要先观察和检验一小部分数据,总结规律

db[0].keys()  // 查看输入的json的所有keys
db[0]['nutrients'][0]  // 查看第一条数据的nutrients字段的第一个值
pd.DataFrame(db[0]['nutrients'])[:7] //查看第一条数据的nutrients字段的前7个值

2. 将数据读入

  • 入读食品数据 nutrients 是一个list类型,需要单独处理,这里要形成一个food的DataFrame,所有挑选有效的数据读入进来
    info_keys = [“description”, “group”, “id”, “manufacturer”]
    info = pd.DataFrame(db, columns=info_keys)
  • 读入nutrients数据,由于每个food的nutri
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值