python pandas学习--操作excel

读取excel
1、基础1

import pandas as pd

def readexcel(file):
    # df = pd.read_excel(file)  # 默认获取第一个sheet页
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    # df = pd.read_excel(file,sheet_name='t')#通过sheet页name取数据
    data = df.head()  #获取表格前5行 ,不包括表头
    row_value = df.iloc[0].values
    row_values = df.iloc[[0,1]].values
    rows_value = df.iloc[:].values
    row_len = df.index.values
    sample_values = df.sample(2).values
    col_vales = df['路径'].values
    print('获取当前页的总行数:',row_len)
    print('获取第一行的数据(不计算表头):',row_value)
    print('获取第1,2行,的数据(不计算表头):',row_values)
    print('获取所有行,的数据(不计算表头):',rows_value)
    print('获取前5行的数据(不计算表头):',data)
    print('随机获取2行的数据(不计算表头):',sample_values )
    print('获取路径这行的数据(不计算表头):',col_vales)
if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

2、基础2 每一行数据变成字典

import pandas as pd

def readexcel(file):
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    for i in df.index.values:
        data1 = df.loc[i].to_dict()
        print(data1)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

效果如下:
在这里插入图片描述
3、基础3 获取所有数据

import pandas as pd
import numpy as np

def readexcel(file):
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    train_data = np.array(df)
    train_list = train_data.tolist()
    print('获取所有的行(不包括表头):\n',train_list)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

4、基础4 读取某个单元格内容

import pandas as pd
def readexcel(file):
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    data = df.iloc[0,1]#'读取第一行第二列的数据'
    print(data)
if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

5、基础5 处理不是从第一列开始有数据的情况

import pandas as pd

def readexcel(file):
    df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
    data = df.head()
    print('读取第一行第二列的数据:\n',data)
if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

如图表格:
在这里插入图片描述
5、基础5–分类统计

import pandas as pd

def readexcel(file):
    # df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    data = df.groupby(['jpg大小']).count()
    print(data)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

6、基础6 常用函数

import pandas as pd

def readexcel(file):
    # df = pd.read_excel(file,sheet_name=2,header=11, usecols='G:H')#通过sheet页索引取数据
    df = pd.read_excel(file,sheet_name=1)#通过sheet页索引取数据
    max_ = df.max()[2]
    min_ = df.min()[2]
    avg = df.mean()
    print('获取最大值:\n',max_)
    print('获取最小值:\n',min_)
    print('avg:\n',avg)

if __name__ == '__main__':
    file = r'test.xls'
    readexcel(file)

7、读取csv,并返回特定列数据

import pandas as ps
def read_csv:
	datas_list = []
	try:
	    df = ps.read_csv(file)
	    for i in  df.index.values:
	        data1 = self.deal_datacases(df['备注'].values[i])
	        data1['游戏名'] = df['标题'].values[i]
	        datas_list.append(data1)
	except:
	    print('文件不存在或路径有问题,请检查!')
if __name__ == '__main__':
    file = r'test.csv'
    read_csv(file)

写入excel
1、字典样式写入excel

在这里插入代码片
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值