系列文章目录
01.csv文件的读写
文章目录
前言
本系列用于记录在pandas使用过程中的遇到的各个功能。
本章节记录对于csv文件的读写。
一、csv文件读取与写入
使用pandas做数据处理的第一步就是读取数据,数据源可以来自于各种地方,csv文件便是其中之一,csv文件其实是一种纯文本文件,由于常用Excel打开,因此本文将csv归属于Excel文件进行描述。
1. read_csv()
read_csv()函数用于读取csv文件,输出内容为DataFrame格式。
本章主要介绍read_csv()以下参数内容。
1.1 filepath_or_buffer
即文件的路径、URL、以及可以是实现read方法的任意对象。
import pandas as pd
pd.read_csv("girl.csv")
结果:

1.2 header
从现有表格中选择一行设置为DataFrame的列名称,默认为 “infer”,即自动推导。若设置为整数n,则表示将表格中的n行设置为列名称;设置为None,则表示不考虑列名称;若设置为list,则将此n行组合为列名称。
但是需要注意与1.3的name的关联关系。
pd.read_csv('girl.csv', header=1) # 不指定names,指定header为1,则选取第二行当做表头,第二行下
结果:

1.3 name
设置DataFrame的列名称,需要为list格式,list中元素个数需要与列对齐,否则会将最后“list中元素个数”行设置为名称,前面的行统一被设置为index。
name设置时会影响header的使用。
- 当names没被赋值时,header会变成0,即选取数据文件的第一行作为列名。
- 当 names 被赋值,header 没被赋值时,那么header会变成None。如果都赋值,就会实现两个参数的组合功能。
举例:
- names 没有被赋值,header 也没赋值:
pd.read_csv('girl.csv') # 我们说这种情况下,header为变成0,即选取文件的第一行作为表头
结果:

- names 没有被赋值,header 被赋值:
pd.read_csv('girl.csv', header=1) # 不指定names,指定header为1,则选取第二行当做表头,第二行下面的是数据
结果:

- names 被赋值,header 没有被赋值:
pd.read_csv('girl.csv', names=["编号", "姓名", "地址"

最低0.47元/天 解锁文章
860

被折叠的 条评论
为什么被折叠?



