Pandas是python的一个数据分析包,纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
一、创建Excel,写入数据
importpandas as pdfrom pandas importDataFrame#写
dic1 = {'标题列1': ['张三','李四'],'标题列2': [80, 90]
}
df=pd.DataFrame(dic1)
df.to_excel('1.xlsx', index=False)
二、读取Excel
importpandas as pdfrom pandas importDataFrame#读
data = pd.read_excel('1.xlsx')#查看所有的值
print(data.values)#查看第一行的值
print(data.values[0])#查看某一列所有的值
print(data['标题列1'].values)#新增列
data['标题列3'] =None#新增行
data.loc[3] = ['王五', 100, '男']#删除行:axis=0
data = data.drop([0,1], axis=0)#删除列:axis=1
data.drop('标题列3', axis=1)#保存
DataFrame(data).to_excel('1.xlsx', sheet_name='Sheet1', index=False, header=True)
三、read_excel的方法说明
pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None,
usecols=None, squeeze=False,dtype=None, engine=None,
converters=None, true_values=None, false_values=None,
skiprows=None, nrows=None, na_values=None, parse_dates=False,
date_parser=None, thousands=None, comment=None, skipfooter=0,
convert_float=True, **kwds)
io:excel文件
sheet_name:返回指定sheet,默认索引0返回第一个,也可用名称,如果返回多个则可用列表,为None则返回全表
header:指定表头,也可用列表指定多行
names:自定义列名,长度和Excel列长度必须一致
index_col:用作索引的列
usecols:读取指定的列,参数为列表,如[0,1]表示第1和第2列