对于pandas读取csv文件浅薄认识

data = pd.read_csv(“log_dir/file”)

读出的数据是一个DataFrame(据我理解类似于二维表格结构),维度data.shape是2维的,数据类型type(data)是DataFrame,将train输出时,输出的不仅有每一列的标签和值,还有每一行的索引值(从开始有数据的那行索引值为0),使用data.values可以把data里的数据提取出来,数据的维度还是二维的,类型变成了numpy.ndarray.,打印data.values时会发现没有了索引值。

df[‘col_name’]

得到的是这一列的数据,不带col_name,是Series 结构,维度是1维,输出含这列的index值和values值。

df[[‘col_name’]]

得到的是一个新的DataFrame值,输出带col_name,维度是二维,输出含索引值和index值。

data[‘col_name’]和data[[‘col_name’]][‘col_name’]的输出结果是一模一样的

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值