使用pandas读写csv文件

最新推荐文章于 2024-07-09 16:25:58 发布

F_aF_a

最新推荐文章于 2024-07-09 16:25:58 发布

阅读量328

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/qq_37252519/article/details/115617859

版权

Python 专栏收录该内容

42 篇文章 0 订阅

订阅专栏

本文档介绍了如何使用Python的pandas库处理CSV文件，包括读取`train.csv`数据，查看其形状、信息和描述性统计，将数据转换为数组，选择特定列，删除指定列，并最终将处理后的数据导出为新的CSV文件。示例中展示了如何选择并删除'x'列，以及创建并导出包含ID和Value的新CSV文件。

摘要由CSDN通过智能技术生成

文章目录

项目结构
F:\PYCHARM\KAGGLE\DIGITRECOGNIZER
│ DataProcessing.py
│ main.py
│ Model.py│
└─data
│ LinearClassifier.csv
│ sample_submission.csv
│ test.csv
│ train.csv

train.csv

test.csv

读取csv

train = pd.read_csv("data/train.csv")

print(train.shape)
(3,2)

print(train)
x y
0 1 1
1 2 4
2 3 9

表头信息

print(train.info())

<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
# Column Non-Null Count Dtype
— ------ -------------- -----
0 x 3 non-null int64
1 y 3 non-null int64
dtypes: int64(2)
memory usage: 176.0 bytes

print(train.train.describe())

转换为数组

print(train.values)

[[1 1]
[2 4]
[3 9]]

选择某一列

print(train["y"])

0 1
1 4
2 9
Name: y, dtype: int64

删除某一列

train.drop("y",1)

x
0 1
1 2
2 3

导出csv

ID和Value是表头

result = list(range(1, 5))
submission = pd.DataFrame({"ID": range(1, 5), "Value": result})
submission.to_csv("data/result1.csv", index=False)
submission.to_csv("data/result2.csv", index=True)

result1.csv

result = list(range(1, 5))
submission = pd.DataFrame({"ID": range(1, 5), "Value": result})
submission.to_csv("data/result2.csv", index=True)
# 多了第一列的数字

result2.csv

F_aF_a

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用pandas读写csv文件

文章目录读取csv表头信息转换为数组选择某一列删除某一列导出csv项目结构F:\PYCHARM\KAGGLE\DIGITRECOGNIZER│ DataProcessing.py│ main.py│ Model.py│└─data│ LinearClassifier.csv│ sample_submission.csv│ test.csv│ train.csvtrain.csvtest.csv读取csvtrain =
复制链接

扫一扫

专栏目录