试验python读取外部数据的几种方式

本文介绍了Python读取CSV文件的三种方式:使用内置的readlines函数,csv模块,以及pandas的read_csv函数。对比了它们的使用方法和特点,适用于小规模数据的读取。
摘要由CSDN通过智能技术生成

摘要

python读取外部csv格式数据,【此处数据非大数据(>6TB),读取大数据利用分段方法】

主要介绍使用python自带的函数read、readlines读取数据转换为数据框,和使用pandas自带的函数read_csv读取csv数据的对比

1、readlines函数读取数据

数据是csv格式,按readlines读取时,每次读取一行,并且把这一行数据作为一个字符串对象;

file="train.csv"
with open(file) as f:
    row=[]
    for line in f.readlines():
        v=list(line.strip().split(","))
        row.append(v)
train=pd.DataFrame(row,columns=row[0])

如下,若csv文件如下:

name age height
xiaohong 18 90
xiaobai 20 100
ming 20 NA

用readlines读取的数据是

['name,age,height','xi
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值