pandas学习 合并两个csv文件中的内容

例子来自于《python数据分析基础》这本书 -->将两个csv文件中的数据合并
7.1.1 葡萄酒质量

葡萄酒质量数据集包括两个文件,一个是红葡萄酒数据文件,另一个是白葡萄酒数据文
件,白葡萄酒是著名的葡萄牙“Vinho Verde”葡萄酒的一个变种。红葡萄酒文件中包含
1599 条观测,白葡萄酒文件中包含 4898 条观测。两个文件中都有 1 个输出变量和 11 个输
入变量。输出变量是酒的质量,是一个从 0(低质量)到 10(高质量)的评分。输入变量
是葡萄酒的物理化学成分和特性,包括非挥发性酸、挥发性酸、柠檬酸、残余糖分、氯化
物、游离二氧化硫、总二氧化硫、密度、pH 值、硫酸盐和酒精含量。
这两个数据集可以通过以下的 URL 下载:
• 红葡萄酒(http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv)
• 白葡萄酒(http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv)
我们不对这两个数据集分别进行分析,而是将它们合成了一个数据集。当你将红葡萄酒数
据和白葡萄酒数据合成一个文件后,结果数据集中应该包括一个标题行和 6497 条观测。
另外,还应该再添加一列,用来区分这行数据是红葡萄酒还是白葡萄酒的数据
。我们要使用的数据集如图 7-1 所示(请注意左侧的行号和第 A 列中新加的“type”变量)。

在这里插入图片描述

先为两个文件添加type列,代码如下

为了向指定位置添加列 我们需要用insert函数
来看insert函数的定义
    def insert(self, loc, column, value, allow_duplicates=False):
        
  • 5
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值