如何读取csv文件?pd.read_csv与csv.reader()之间的区别

如何读取csv文件

pd.read_csv

import pandas as pd 
data=pd.read_csv(‘file.csv’)

data = pd.read_csv('./result.csv',sep=',')
data=pd.read_csv('./result.csv',header=None,prefix='XX')
data = pd.read_csv('./result.csv',nrows = 4)

参数意义:

sep:如果不指定参数,则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子:’\r\t’。

header: 指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0【第一行数据】,否则设置为None。如果明确设定 header = 0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3]。注意:如果skip_blank_lines=True 那么header参数忽略注释行和空行,所以header=0表示第一行数据而不是文件的第一行

skip_blank_lines: boolean, default True: 如果为True,则跳过空行;否则记为NaN。

prefix:希望达到列名称有规律的情况下,将header设定为None,给列添加前缀。例如:添加prefix= ‘X’ 使得列名称成为 X0, X1, …

nrows: 需要读取的行数(从文件头开始算起)

csv.reader()

打开csv文件还可以使用csv.reader(),与data=pd.read_csv(‘file.csv’)不同的是,csv.reader()从csv文件中读取的每一行都作为字符串列表返回。而pd.read_csv()则是返回一个数据框(dataframe)文件。
CSV库中的四个常用函数
csv.reader:以列表的形式返回读取的数据。
csv.writer:以列表的形式写入数据。
csv.DictReader:以字典的形式返回读取的数据。
csv.DictWriter:以字典的形式写入数据。

如何处理dataframe中的数据?

切片
data1=data.iloc[:,0:10] # first 10 columns
data1=data.iloc[0:5] # first 5 rows
data1=data.iloc[0:5,0:5] # first 5 rows of the first 5 columns

my_data_array=data1.values
#将数据框架转换为数组,用于numpy、sklearn算法等的使用。
To convert a dataframe into an array, for use with numpy, sklearn algorithms etc:

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值