一、什么是CSV文件?
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。
二、基本操作
第一步:导入Pandas和Numpy包。
import numpy as np
import pandas as pd
第二步:读取文件,列出集中导入的操作。
1.导入csv文件数据
#几种基本的操作
test = pd.read_csv("F:/test.csv")#基本导入的操作
test.head()
test = pd.read_csv("F:/test.csv" , index_col = 0)#默认第一列作为第一列
test.head()
test = pd.read_csv("F:/test.csv" , header = None)#没有头标题的时候
test.head()
test = pd.read_csv("F:/test.csv" , dtype['a':np.float64])#转换某一个列的属性
test.head()
test = pd.read_csv("F:/test.csv" , names = ["" , "" , ""])#换头
test.head()
test = pd.read_csv("F:/test.csv" , sep = ",")#以问号为分隔符
test.head()
test = pd.read_csv("F:/test.csv" , skiprows = [0 , 3] , skip_footer = 1 , engine = "python")
#skiprows只能跳过特定的几行数据 , skip_footer倒着往回跳过行数 , 不写会报错
test.head()
test = pd.read_csv("F:/test.csv" , skiprows = [0 , 3] , )#skiprows只能跳过特定的几行数据 , skip_footer倒着往回跳过行数
test.head()
2.导入excel数据
#几种基本的操作
test = pd.read_excel("F:/test.xlsx")#基本方法,读入excel文件
test.head()
test = pd.read_excel("F:/test.xlsx" , sheet_name = "xxx")#读入excel文件指定页面的数据
test.head()
text.to_excel("F:/test1.xlsx")#导出到指定位置xls文件
from pandas import ExcelWriter#利用ExcelWriter将多个数据导入同一个excel文件
with ExcelWriter("F:/test.xlsx") as writer:
text.to_excel(writer , sheet_name = "s1")
text.to_excel(writer , sheet_name = "s2")
3.导入json数据
test = pd.read_json("F:/test")
#注意这个地方的json是没有顺序的,