Pandas CSV文件读取储存_pandas读取csv是什么存储格式-CSDN博客

本文链接：https://blog.csdn.net/a484879664/article/details/138586256

CSV:文件以纯文本形式存储表格数据（数字和文本）

df=pd.read_csv(file_path,sep=",|:|;",engine="python",header=0,encoding='gbk')

file_path: 这是CSV文件的路径。您需要将 file_path 替换为实际的文件路径字符串，例如 'C:/Users/48487/Desktop/nba.csv'。
sep=",|:|;": 这个参数指定了分隔符。默认情况下，read_csv 期望使用逗号（,）作为字段分隔符。但有时CSV文件可能使用其他的分隔符，比如分号（;）、冒号（:）或其他特殊字符。在这里，您指定了一个正则表达式，用来匹配逗号、冒号或分号作为字段分隔符。这在处理那些使用不同分隔符的文件时非常有用。
engine="python": 这个参数指定了用于解析CSV文件的引擎。pandas 提供了两种引擎：python 和 c。python 引擎是纯Python实现，而 c 引擎是一个更快的Cython实现。在大多数情况下，使用默认的 c 引擎会更快。但是，如果您的CSV文件格式非常特殊或者包含大量转义字符，python 引擎可能更加稳健。
header=0: 这个参数指定哪一行作为列名。在这里，header=0 表示第一行（行索引从0开始）将被用作列名。如果您的CSV文件中没有列标题，您可以将其设置为 None。
encoding='gbk': 这个参数指定了文件的编码格式。在这里，您使用了 gbk 编码，这是用于简体中文字符的编码格式之一。如果您的CSV文件使用了不同的编码，您需要相应地更改这个参数。例如，对于使用UTF-8编码的文件，您应该使用 encoding='utf-8'。