Pandas CSV文件读取储存

读取文件pd.read_csv()

CSV:文件以纯文本形式存储表格数据(数字和文本)

df=pd.read_csv(file_path,sep=",|:|;",engine="python",header=0,encoding='gbk')

  1. file_path: 这是CSV文件的路径。您需要将 file_path 替换为实际的文件路径字符串,例如 'C:/Users/48487/Desktop/nba.csv'

  2. sep=",|:|;": 这个参数指定了分隔符。默认情况下,read_csv 期望使用逗号(,)作为字段分隔符。但有时CSV文件可能使用其他的分隔符,比如分号(;)、冒号(:)或其他特殊字符。在这里,您指定了一个正则表达式,用来匹配逗号、冒号或分号作为字段分隔符。这在处理那些使用不同分隔符的文件时非常有用。

  3. engine="python": 这个参数指定了用于解析CSV文件的引擎。pandas 提供了两种引擎:pythoncpython 引擎是纯Python实现,而 c 引擎是一个更快的Cython实现。在大多数情况下,使用默认的 c 引擎会更快。但是,如果您的CSV文件格式非常特殊或者包含大量转义字符,python 引擎可能更加稳健。

  4. header=0: 这个参数指定哪一行作为列名。在这里,header=0 表示第一行(行索引从0开始)将被用作列名。如果您的CSV文件中没有列标题,您可以将其设置为 None

  5. encoding='gbk': 这个参数指定了文件的编码格式。在这里,您使用了 gbk 编码,这是用于简体中文字符的编码格式之一。如果您的CSV文件使用了不同的编码,您需要相应地更改这个参数。例如,对于使用UTF-8编码的文件,您应该使用 encoding='utf-8'

综上所述,代码行配置了 read_csv 函数来读取一个可能使用不同分隔符的CSV文件,且该文件的列名位于第一行,使用 gbk 编码。如果CSV文件符合这些条件,df 将是一个包含文件数据的 DataFrame 对象。

print(df.to_string())

to_string() 用于返回 DataFrame 类型的数据,如果不使用该函数,则输出结果为数据的前面 5 行和末尾 5 行,中间部分以 ... 代替。

将DataFrame存储为CSV文件:to_csv()

回顾了好几个知识点:1创建DataFrame 2存储为CSV文件 3打开CSV文件

df.to_csv('num.csv',index=False)如果这句话中缺少index=False

会导致索引也变成文件内一列,心都死了

读取前几行.head()

head()括号内若不填写,默认前五行

读取后几行.tail()

tail()括号内若不填写,默认后五行

获取表格基本信息.info()

可以得出458行,第一行编号0

9列,每列数据类型,non-null,意思为非空的数据,

一个float64,3个int64,5个object

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值