使用pandas进行读取、合并、写入csv文件

最新推荐文章于 2024-08-07 19:38:10 发布

Begonia_cat

最新推荐文章于 2024-08-07 19:38:10 发布

阅读量1.1w

点赞数 2

分类专栏：笔记文章标签： python 机器学习开发语言

本文链接：https://blog.csdn.net/qq_44250700/article/details/125238838

版权

笔记专栏收录该内容

16 篇文章 2 订阅

订阅专栏

这篇博客介绍了如何使用pandas在Python中处理CSV文件。首先，通过`pd.read_csv()`函数分别读取了两个CSV文件。接着，利用`pd.merge()`函数以songID为共用列进行数据合并，生成新的DataFrame。最后，使用`dataframe.to_csv()`将合并后的数据保存到新的CSV文件中。注意合并时，如果两个文件的songID数量不一致，结果将只包含公共元素。

摘要由CSDN通过智能技术生成

文章目录

导包
读取csv文件——`pd.read_csv('path')`
合并csv文件——`pd.merge(文件1，文件2，on = [共同的列名])`
写入csv文件——`dataframe.to_csv(path)`

导包

import pandas as pd
import os

读取csv文件——`pd.read_csv('path')`

1、读取第一个csv文件

features = pd.read_csv('C:/Users/24061/Desktop/MERcode/1-danz1ka19___pradeepKumar/SourceCode/Emotion_features_revised.csv', index_col=0)
features

在这里插入图片描述
2、读取第二个csv文件

labels = pd.read_csv('C:/Users/24061/Desktop/MERcode/EMOPIA_cls-main/EMOPIA_cls-main/EMOPIA_1.0/EMOPIA_1.0/metadata_by_song.csv', index_col=0)
labels

在这里插入图片描述

合并csv文件——`pd.merge(文件1，文件2，on = [共同的列名])`

从上述读取的两个文件中，可以看到两个文件中有不同的内容，相同点是：二者都有songID这个列。因此，可以根据songID为合并条件进行合并。

datasets = pd.merge(features, labels, on=["songID"])
datasets

在这里插入图片描述
合并完成！
注意：

合并之后，文件1中的内容在前，文件2中的内容在后。因此，可以根据自己的需求，决定哪个文件应该放在文件1的位置，哪个文件应该放在文件2的位置。
因为两个csv文件是根据相同的列元素建立连接的，因此，若文件1中的songID有386个元素，文件2中的songID有318个元素，并且这318个元素在文件1中都可以找到对应的时，则合并之后songID列只有318个元素。即：作为连接条件的那一列只会保留二者公共的元素。

在这里插入图片描述

写入csv文件——`dataframe.to_csv(path)`

注意dataframe.to_csv(path)里的dataframe只是一个指代，代之想要存进csv文件中的dataframe。在本例中指：合并生成的datasets。因此代码如下：

# 将合并之后的Dataframe保存进csv文件：

datasets.to_csv('C:/Users/24061/Desktop/MERcode//1-danz1ka19___pradeepKumar_/SourceCode/Emotion_features_revised_final.csv')