使用pandas读入csv文件；保存csv文件。

最新推荐文章于 2024-07-09 16:25:58 发布

Mr_Zhao1024

最新推荐文章于 2024-07-09 16:25:58 发布

阅读量6.3k

点赞数 2

文章标签： python 机器学习深度学习

本文链接：https://blog.csdn.net/weixin_40006291/article/details/121702319

版权

一、使用pd.read_csv（）函数进行读取.csv文件

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=False, compact_ints=False, use_unsigned=False, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)

常用参数解析：

1、filepath_or_buffer:（这是唯一一个必须有的参数，其它都是按需求选用的）

目标文件所在的路径

2、sep：

指定分隔符，默认是',' 逗号

3、delimiter : str, default None

定界符，备选分隔符（如果指定该参数，则sep参数失效）

4、header：int or list of ints, default ‘infer’

指定哪一行作为表头。默认设置为0（即第一行作为表头），如果没有表头的话，要修改参数，设置header=None

5、names：

指定列的名称，用列表表示。一般我们没有表头，即header=None时，使用这个参数。

6、index_col：

指定哪一列数据作为行索引，可以是一列，也可以多列。多列的话，会看到一个分层索引

7、prefix:

给列名添加前缀。如prefix="x",会出来"x1"、"x2"、"x3"。

8.nrows : int, default None

需要读取的行数（从文件头开始算起）

9.encoding: 当出现乱码的时候参考官网文档

codecs — Codec registry and base classes — Python 3.10.0 documentation

10.skiprows : list-like or integer, default None

需要忽略的行数（从文件开始处算起），或需要跳过的行号列表（从0开始）

举例子：

import os
import pandas as pd
data_dir = r'D:\work\体质数据集\data'
edge_test = pd.read_csv(os.path.join(data_dir, 'B_id.csv'), sep=',')
print(edge_test)

二、pd.to_csv()

作用：将数据框写入本地电脑，保存起来

首先读取当前的工作路径

import os
father_path = os.getcwd()
father_path

pd.to_csv(path_or_buf,sep,na_rep,columns,header,index)

参数解析：

1.path_or_buf：字符串，放文件名、相对路径、文件流等；

2.sep：字符串，分隔符，跟read_csv()的一个意思

3.na_rep：字符串，将NaN转换为特定值

4.columns：列表，指定哪些列写进去

5.header：默认header=0，如果没有表头，设置header=None，表示没有表头。

6.index：关于索引的，默认True,写入索引

举例：

dataframe = pd.DataFrame({'user_node': list1, 'tizhi_node': list2, 'rate': 1})
dataframe.to_csv(r"D:\work\体质数据集\data\train.csv", sep=',')

Mr_Zhao1024

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
使用pandas读入csv文件；保存csv文件。

一、使用pd.read_csv（）函数进行读取.csv文件pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None
复制链接

扫一扫