pandas记录——01.csv文件的读写

系列文章目录

01.csv文件的读写



前言

本系列用于记录在pandas使用过程中的遇到的各个功能。
本章节记录对于csv文件的读写。


一、csv文件读取与写入

使用pandas做数据处理的第一步就是读取数据,数据源可以来自于各种地方,csv文件便是其中之一,csv文件其实是一种纯文本文件,由于常用Excel打开,因此本文将csv归属于Excel文件进行描述。

1. read_csv()

read_csv()函数用于读取csv文件,输出内容为DataFrame格式。
本章主要介绍read_csv()以下参数内容。

1.1 filepath_or_buffer

即文件的路径、URL、以及可以是实现read方法的任意对象。

import pandas as pd 
pd.read_csv("girl.csv")

结果:
在这里插入图片描述

1.2 header

从现有表格中选择一行设置为DataFrame的列名称,默认为 “infer”,即自动推导。若设置为整数n,则表示将表格中的n行设置为列名称;设置为None,则表示不考虑列名称;若设置为list,则将此n行组合为列名称。

但是需要注意与1.3的name的关联关系。

pd.read_csv('girl.csv', header=1) # 不指定names,指定header为1,则选取第二行当做表头,第二行下

结果:
在这里插入图片描述

1.3 name

设置DataFrame的列名称,需要为list格式,list中元素个数需要与列对齐,否则会将最后“list中元素个数”行设置为名称,前面的行统一被设置为index。

name设置时会影响header的使用。

  • 当names没被赋值时,header会变成0,即选取数据文件的第一行作为列名。
  • 当 names 被赋值,header 没被赋值时,那么header会变成None。如果都赋值,就会实现两个参数的组合功能。

举例:

  1. names 没有被赋值,header 也没赋值:
pd.read_csv('girl.csv') # 我们说这种情况下,header为变成0,即选取文件的第一行作为表头

结果:
在这里插入图片描述

  1. names 没有被赋值,header 被赋值:
pd.read_csv('girl.csv', header=1) # 不指定names,指定header为1,则选取第二行当做表头,第二行下面的是数据

结果:
在这里插入图片描述

  1. names 被赋值,header 没有被赋值:
pd.read_csv('girl.csv', names=["编号", "姓名", "地址"
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值