直接开始
import os
import pandas as pd
// 获取当前位置的路径
os.getcwd()
//定位到指定路径 (目的是在读取或保存 写路径时只写文件名加后缀就可以了)
os.chdir("D:\py_datasets")
// 读取csv文件
df = pd.read_csv("AirPassengers.csv",encoding='utf-8',
dtype={"date":str}, // dtype 让某一列数据的类型成为想要的类型
nrows=10, // nrows 只读取前几行
na_values=70 ) // na_values 多少代表缺失值
df.head(5) // 查看前五行;
df.tail(5) // 查看最后五行
// 读取excel表
// 批量读取工作簿里面的内容(excel里会有多个工作簿),并合并成一个大的数据框
// 已知:sheet_name为工作簿名字组成的列表(如sheet_name=["工作表1","工作表2","工作表3"])
data_all = pd.DataFrame()
for i in sheet_name:
data = pd.read_excel('XXX.xlsx',encoding='gbk',sheet_name = i)
data_all = pd.concat([data_all,data],axis=0,ignore_index = True)
*excel表会有多个工作簿
// 把数据框保存下来
data_all.to_csv('路径.csv',index = False) # index=False 不写入索引
data_all.to_excel('路径.xlsx',index = False)