数据分析实例 USDA 数据

最新推荐文章于 2021-10-22 17:03:58 发布

阿农安贵人

最新推荐文章于 2021-10-22 17:03:58 发布

阅读量901

点赞数

分类专栏： Python pandas 文章标签： Pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sfw_123817/article/details/82626679

版权

本文介绍如何分析USDA数据，首先通过观察和检验数据总结规律，然后使用Pandas将数据读入并合并，创建一个大表，便于后续的切块、聚合和图形化操作。过程中注意数据去重和列名重命名。

摘要由CSDN通过智能技术生成

观察，检验基本的数据。并将USDA的数据整合到一张大表中，方便后面的切块，聚合，图形化等工作

1. 观察并检验数据, 数据集一般都很多大，我们要先观察和检验一小部分数据，总结规律

db[0].keys()  // 查看输入的json的所有keys
db[0]['nutrients'][0]  // 查看第一条数据的nutrients字段的第一个值
pd.DataFrame(db[0]['nutrients'])[:7] //查看第一条数据的nutrients字段的前7个值

2. 将数据读入

入读食品数据 nutrients 是一个list类型，需要单独处理，这里要形成一个food的DataFrame，所有挑选有效的数据读入进来
info_keys = [“description”, “group”, “id”, “manufacturer”]
info = pd.DataFrame(db, columns=info_keys)
读入nutrients数据，由于每个food的nutri

最低0.47元/天解锁文章

阿农安贵人

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

阿农安贵人 CSDN认证博客专家 CSDN认证企业博客

码龄20年

30: 原创

27万+: 周排名

116万+: 总排名

19万+: 访问

: 等级

1172: 积分

6: 粉丝

9: 获赞

7: 评论

38: 收藏

私信

关注

热门文章

分类专栏

SQL 1篇
Git 1篇
Linux 6篇
Windows & DotNet 4篇
Web 6篇
Python 15篇
Python； 3篇
Docker 1篇
NLP 2篇
React 1篇
pandas 1篇

最新评论

统计词频并可视化
忞锋淼: 谢谢，给了很大的帮助
使用Python访问软连接
weixin_36049506: 不好使啊老哥，我用real_dir=os.popen(link_dir).readline()解决的
词向量 - 实际动手使用word2vec
Anonymous-: 构件词向量时显示第八行代码出错：Traceback (most recent call last): File "D:/Graduation design/分词训练/vector.py", line 8, in <module> train_sentences = pd.Series(fileTrainRead.iloc[:, 1])
安装Paramiko遇到的问题以及解决方法
kriszhang: c/_cffi_backend.c:15:17: fatal error: ffi.h: No such file or directory 又出现了这个错误，怎么回事呀？
安装Paramiko遇到的问题以及解决方法
kriszhang: 谢谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。