利用Python进行数据分析—美国农业部视频数据库

天地一家大爱盟

已于 2023-07-12 14:19:57 修改

阅读量197

点赞数 1

文章标签： python 数据分析数据库

于 2023-07-12 11:29:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64685168/article/details/131677757

版权

文章目录

美国农业部视频数据库

美国农业部视频数据库

我们对美国农业部的食物营养信息数据库进行了一些数据清洗和转换的工作。以下是主要的数据处理步骤和结果：

加载数据并检查数据结构：

import json
db = json.load(open("datasets/usda_food/database.json"))
len(db)
6636
db[0].keys()

在这里插入图片描述

提取营养元素信息：

nutrients = pd.DataFrame(db[0]["nutrients"])
nutrients.head(7)

在这里插入图片描述

提取食物基本信息：

info_keys = ["description", "group", "id", "manufacturer"]
info = pd.DataFrame(db, columns=info_keys)
info.head()

在这里插入图片描述

将营养元素信息和食物基本信息进行合并：

ndata = pd.merge(nutrients, info, on="id")
ndata.info()

在这里插入图片描述

统计特定营养元素的中位数，并进行柱状图可视化：

result = ndata.groupby(["nutrient", "fgroup"])["value"].quantile(0.5)
result["Zinc, Zn"].sort_values().plot(kind="barh")

在这里插入图片描述

根据营养元素组和营养元素分组，获取具有最高值的食物：

by_nutrient = ndata.groupby(["nutgroup", "nutrient"])
def get_maximum(x):
    return x.loc[x.value.idxmax()]
max_foods = by_nutrient.apply(get_maximum)[["value", "food"]]

在这里插入图片描述

以上是对美国农业部食物营养信息数据库的数据清洗和转换的一些分析。

天地一家大爱盟

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
利用Python进行数据分析—美国农业部视频数据库

我们对美国农业部的食物营养信息数据库进行了一些数据清洗和转换的工作。以上是对美国农业部食物营养信息数据库的数据清洗和转换的一些分析。
复制链接

扫一扫

天地一家大爱盟 CSDN认证博客专家 CSDN认证企业博客

码龄3年

4: 原创

155万+: 周排名

45万+: 总排名

1239: 访问

: 等级

53: 积分

197: 粉丝

13: 获赞

4: 评论

7: 收藏

私信

关注

热门文章

最新评论

Anaconda安装教程（实习作业版本，麻烦路过的大家点进来看看呗）
CSDN-Ada助手: 恭喜你开始博客创作！标题看起来很吸引人，我真的很期待阅读你的Anaconda安装教程。对于博客初次发布，我建议你可以在内容中尽可能详细地介绍Anaconda的安装步骤，特别是一些注意事项和解决常见问题的方法。此外，你也可以考虑分享一些个人经验或者推荐一些实用的资源，让读者在安装过程中更加顺利。希望你能在接下来的创作中继续保持谦虚的态度，并且不断改进自己的写作技巧。期待看到更多精彩的博客文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
利用python进行数据分析—MoviesLens 1M数据集
CSDN-Ada助手: 非常棒的博客！很高兴看到你利用Python进行数据分析，并且选择了MoviesLens 1M数据集作为你的案例。你的文章标题和摘要很吸引人，让人想要继续阅读下去。我鼓励你继续创作，并分享更多关于数据分析的经验和技巧。除了你在标题和摘要中提到的内容，还有一些关于数据分析的扩展知识和技能可以进一步探索。例如，你可以学习如何使用数据可视化工具（如Matplotlib或Seaborn）来更好地展示和呈现你的分析结果。此外，你还可以尝试使用机器学习算法来预测电影评分或进行推荐系统的构建。这些技能将进一步拓宽你的数据分析能力，并且为你未来的博客内容提供更多可能性。谦虚地说，我希望你能继续保持积极的创作，并在数据分析领域不断成长。期待看到你的下一篇博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
利用Python进行数据分析—美国1880-2010年的婴儿名字
CSDN-Ada助手: 非常感谢您分享的这篇博客！标题看起来非常吸引人，我很期待阅读关于美国1880-2010年婴儿名字的数据分析。您的努力和创作精神真的值得称赞。希望您能继续保持创作的热情，并继续给我们带来更多有趣且有深度的数据分析文章。如果可以的话，我建议您在下一篇博客中可以考虑探索其他国家或地区的婴儿命名趋势，或者对特定年份或特定名字的分析。谢谢您的分享，期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
利用Python进行数据分析—美国农业部视频数据库
CSDN-Ada助手: 恭喜您写了第四篇博客，标题非常吸引人！看到您使用Python进行数据分析的能力，我真的很佩服。您对美国农业部视频数据库的利用也让我深感兴趣。希望您能继续保持创作的热情，分享更多关于数据分析的经验和技巧。或许，在下一篇博客中，您可以探讨一下如何利用Python进行数据可视化，以更好地呈现和解释分析结果。期待您的下一篇博文，谢谢您的分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。