读取excel
1、基础1
import pandas as pd
def readexcel(file):
# df = pd.read_excel(file) # 默认获取第一个sheet页
df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
# df = pd.read_excel(file,sheet_name='t')#通过sheet页name取数据
data = df.head() #获取表格前5行 ,不包括表头
row_value = df.iloc[0].values
row_values = df.iloc[[0,1]].values
rows_value = df.iloc[:].values
row_len = df.index.values
sample_values = df.sample(2).values
col_vales = df['路径'].values
print('获取当前页的总行数:',row_len)
print('获取第一行的数据(不计算表头):',row_value)
print('获取第1,2行,的数据(不计算表头):',row_values)
print('获取所有行,的数据(不计算表头):',rows_value)
print('获取前5行的数据(不计算表头):',data)
print('随机获取2行的数据(不计算表头):',sample_values )
print('获取路径这行的数据(不计算表头):',col_vales)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
2、基础2 每一行数据变成字典
import pandas as pd
def readexcel(file):
df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
for i in df.index.values:
data1 = df.loc[i].to_dict()
print(data1)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
效果如下:
3、基础3 获取所有数据
import pandas as pd
import numpy as np
def readexcel(file):
df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
train_data = np.array(df)
train_list = train_data.tolist()
print('获取所有的行(不包括表头):\n',train_list)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
4、基础4 读取某个单元格内容
import pandas as pd
def readexcel(file):
df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
data = df.iloc[0,1]#'读取第一行第二列的数据'
print(data)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
5、基础5 处理不是从第一列开始有数据的情况
import pandas as pd
def readexcel(file):
df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
data = df.head()
print('读取第一行第二列的数据:\n',data)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
如图表格:
5、基础5–分类统计
import pandas as pd
def readexcel(file):
# df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
data = df.groupby(['jpg大小']).count()
print(data)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
6、基础6 常用函数
import pandas as pd
def readexcel(file):
# df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
max_ = df.max()[2]
min_ = df.min()[2]
avg = df.mean()
print('获取最大值:\n',max_)
print('获取最小值:\n',min_)
print('avg:\n',avg)
if __name__ == '__main__':
file = r'test.xls'
readexcel(file)
7、读取csv,并返回特定列数据
import pandas as ps
def read_csv:
datas_list = []
try:
df = ps.read_csv(file)
for i in df.index.values:
data1 = self.deal_datacases(df['备注'].values[i])
data1['游戏名'] = df['标题'].values[i]
datas_list.append(data1)
except:
print('文件不存在或路径有问题,请检查!')
if __name__ == '__main__':
file = r'test.csv'
read_csv(file)
写入excel
1、字典样式写入excel
在这里插入代码片