python to csv参数_pd.read_csv() 、to_csv() 之常用参数

最新推荐文章于 2024-06-14 11:18:43 发布

weixin_39942351

最新推荐文章于 2024-06-14 11:18:43 发布

阅读量5.1k

点赞数 2

文章标签： python to csv参数

本文简单介绍一下read_csv()和 to_csv()的参数，最常用的拿出来讲，较少用的请转到官方文档看。

一.pd.read_csv()

作用：将csv文件读入并转化为数据框形式。

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=False, compact_ints=False, use_unsigned=False, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)

好多参数呀！

下面来看常用参数：

1.filepath_or_buffer:(这是唯一一个必须有的参数，其它都是按需求选用的)

文件所在处的路径

2.sep：

指定分隔符，默认为逗号','

3.delimiter : str, default None

定界符，备选分隔符(如果指定该参数，则sep参数失效)

4.header：int or list of ints, default ‘infer’

指定哪一行作为表头。默认设置为0(即第一行作为表头)，如果没有表头的话，要修改参数，设置header=None

5.names：

指定列的名称，用列表表示。一般我们没有表头，即header=None时，这个用来添加列名就很有用啦！

6.index_col:

指定哪一列数据作为行索引，可以是一列，也可以多列。多列的话，会看到一个分层索引

7.prefix:

给列名添加前缀。如prefix="x",会出来"x1"、"x2"、"x3"酱纸

8.nrows : int, default None

需要读取的行数(从文件头开始算起)

10.skiprows : list-like or integer, default None

需要忽略的行数(从文件开始处算起)，或需要跳过的行号列表(从0开始)。

下面是举栗子时间：

import pandas as pd

data = pd.read_csv(r"G:\data\Kaggle\Titanic\train.csv")

data.head()

PassengerId

Survived

Pclass

Name

Sex

Age

SibSp

Parch

Ticket

Fare

Cabin

Embarked

Braund, Mr. Owen Harris

male

22.0

A/5 21171

7.2500

NaN

Cumings, Mrs. John Bradley (Florence Briggs Th...

female

38.0

PC 17599

71.2833

C85

Heikkinen, Miss. Laina

female

26.0

STON/O2. 3101282

7.9250

NaN

Futrelle, Mrs. Jacques Heath (Lily May Peel)

female

35.0

113803

53.1000

C123

Allen, Mr. William Henry

male

35.0

373450

8.0500

NaN

data1 = pd.read_csv(r"G:\data\Kaggle\Titanic\train.csv",header=None) #可以看到表头都直接当作数据在用了

data1.head()

PassengerId

Survived

Pclass

Name

Sex

Age

SibSp

Parch

Ticket

Fare

Cabin

Embarked

Braund, Mr. Owen Harris

male

A/5 21171

7.25

NaN

Cumings, Mrs. John Bradley (Florence Briggs Th...

female

PC 17599

71.2833

C85

Heikkinen, Miss. Laina

female

STON/O2. 3101282

7.925

NaN

Futrelle, Mrs. Jacques Heath (Lily May Peel)

female

113803

53.1

C123

data2 = pd.read_csv(r"G:\data\Kaggle\Titanic\train.csv",index_col=["Survived","Sex"])

data2.head()

PassengerId

Pclass

Name

Age

SibSp

Parch

Ticket

Fare

Cabin

Embarked

Survived

Sex

male

Braund, Mr. Owen Harris

22.0

A/5 21171

7.2500

NaN

female

Cumings, Mrs. John Bradley (Florence Briggs Th...

38.0

PC 17599

71.2833

C85

female

Heikkinen, Miss. Laina

26.0

STON/O2. 3101282

7.9250

NaN

female

Futrelle, Mrs. Jacques Heath (Lily May Peel)

35.0

113803

53.1000

C123

male

Allen, Mr. William Henry

35.0

373450

8.0500

NaN

data3 = pd.read_csv(r"G:\data\Kaggle\Titanic\train.csv", skiprows=3, header=None) #包括表头的前三行被跳过了

data3.head()

Heikkinen, Miss. Laina

female

26.0

STON/O2. 3101282

7.9250

NaN

Futrelle, Mrs. Jacques Heath (Lily May Peel)

female

35.0

113803

53.1000

C123

Allen, Mr. William Henry

male

35.0

373450

8.0500

NaN

Moran, Mr. James

male

NaN

330877

8.4583

NaN

McCarthy, Mr. Timothy J

male

54.0

17463

51.8625

E46

二.pd.to_csv()

作用：将数据框写入本地电脑，保存起来

先了解一下当前工作路径

import os

father_path = os.getcwd()

father_path

'C:\\Users\\acerpc'

to_csv(path_or_buf,sep,na_rep,columns,header,index)

参数解析：

1.path_or_buf：字符串，放文件名、相对路径、文件流等；

2.sep：字符串，分隔符，跟read_csv()的一个意思

3.na_rep：字符串，将NaN转换为特定值

4.columns：列表，指定哪些列写进去

5.header：默认header=0，如果没有表头，设置header=None，表示我没有表头呀！

6.index：关于索引的，默认True,写入索引

举栗子时间到：

import numpy as np

df = pd.DataFrame({"a":[1,2,3],

"b":[6,np.nan,6],

"c":[3,4,np.nan]})

6.0

3.0

NaN

4.0

6.0

NaN

path1 = father_path + r'\df1.csv'

df.to_csv(path1)

path2 = father_path + r'\df2.csv'

df.to_csv(path2,header=None)

path3 = father_path + r'\df3.csv'

df.to_csv(path3, columns=["a","c"],index=False)

path4 = father_path + r'\df4.csv'

df.to_csv(path4, na_rep=0)

weixin_39942351

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python to csv参数_pd.read_csv() 、to_csv() 之 常用参数

python to csv参数_pd.read_csv() 、to_csv() 之常用参数