1、pandas概述
首先,需要转成xls的格式,或者读取csv文件也可以:
放在同一个目录下,导包、读取文件:
import pandas as pd
df=pd.read_excel('data.xls')
print(df.head()) # 默认读取前5行
print(df.head(10)) # 读取前10行
print(df.info()) #返回当前信息
2、pandas基本操作
print(df.columns) # 列名
print(df.values) # 列值
print(df['gender'][:10]) # 读取某一列的前10行
获取‘age’列,读取前10行,对age做*10操作,求age最大值,均值,最小值:
age =df['age']
print(age[:10])
print((age*10)[:10])
print(age.max(),age.mean())
print(df.describe()) # 统计样本,均值,大小值
print(df[['gender',&