python处理表格的常用知识
1. 读取或者连接excel
借助pandas模块(需要先安装pandas模块)
import pandas as pd
data=pd.read_excel('C:\\Users\\C++成绩.xls',sheet_name=0,header=1)
print(data) #将表格全部显示出来
sheet_name=0的意思就是 该excel中所有sheet都可以提取如果你想提取某sheet_name=1 就是提取该excel中第一个sheet
heard 属性是从0开始,o代表一行 hear=1就是重第二行开始的(我的excel表中有头文件所有去除了首行)
2.几个常用的操作:
上面我们将excel给了data 所以下面是data.xx
data.shape #打印显示表格的属性
data.columns # 打印表格所有列的名字
data.count() #查看每列统计的数据
data.sample(5) #随机打印数据集5行
data.tail() #默认显示后五行
data.head() #默认显示前五行
data.info() #查看缺失值(空值的情况)
data.columns=[‘ 列名1’,’列名2 ’] #设置表头
data.set_index(‘ID’,inplace=True) #用自己设置的索引而不是系统自动生成的
hear=none #不设置表头
data.to_excel(‘D://