pandas学习合并两个csv文件中的内容

最新推荐文章于 2024-09-02 16:47:03 发布

小熊提伯斯

最新推荐文章于 2024-09-02 16:47:03 发布

阅读量1.2w

点赞数 5

分类专栏： Python学习文章标签：数据分析

本文链接：https://blog.csdn.net/qq_30500113/article/details/97395137

版权

根据《python数据分析基础》中的示例，本文介绍如何合并两个CSV文件，分别对应红葡萄酒和白葡萄酒的数据。每个文件包含了酒的质量评分和物理化学特性。通过添加‘type’列来区分红白葡萄酒，并将两个数据集合并成一个，包含6497条观测。最终合并后的数据集新增了‘type’列，用于标识葡萄酒类型。

摘要由CSDN通过智能技术生成

例子来自于《python数据分析基础》这本书 -->将两个csv文件中的数据合并
7.1.1　葡萄酒质量

葡萄酒质量数据集包括两个文件，一个是红葡萄酒数据文件，另一个是白葡萄酒数据文
件，白葡萄酒是著名的葡萄牙“Vinho Verde”葡萄酒的一个变种。红葡萄酒文件中包含
1599 条观测，白葡萄酒文件中包含 4898 条观测。两个文件中都有 1 个输出变量和 11 个输
入变量。输出变量是酒的质量，是一个从 0（低质量）到 10（高质量）的评分。输入变量
是葡萄酒的物理化学成分和特性，包括非挥发性酸、挥发性酸、柠檬酸、残余糖分、氯化
物、游离二氧化硫、总二氧化硫、密度、pH 值、硫酸盐和酒精含量。
这两个数据集可以通过以下的 URL 下载：
• 红葡萄酒（http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv）
• 白葡萄酒（http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv）
我们不对这两个数据集分别进行分析，而是将它们合成了一个数据集。当你将红葡萄酒数
据和白葡萄酒数据合成一个文件后，结果数据集中应该包括一个标题行和 6497 条观测。
另外，还应该再添加一列，用来区分这行数据是红葡萄酒还是白葡萄酒的数据
。我们要使用的数据集如图 7-1 所示（请注意左侧的行号和第 A 列中新加的“type”变量）。

在这里插入图片描述

先为两个文件添加type列，代码如下

为了向指定位置添加列 我们需要用insert函数
来看insert函数的定义
    def insert(self, loc, column, value, allow_duplicates=False):

最低0.47元/天解锁文章

小熊提伯斯

关注

5
点赞
踩
26

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pandas学习 合并两个csv文件中的内容

pandas学习合并两个csv文件中的内容