pandas

pandas处理interface


#
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

#1、生成数据
#2、求和,平均值等
#print(np.arange(0,100,2))
arr1 = np.array([
    [1,2,3,4,5],
    [2,3,45,5,6]
])

print(arr1.shape)
print(arr1[0].sum())

'''
pandas 
操作是二维的
'''
#1、读取文本
df=pd.read_excel("interface1.xls")
#print(df)
print("=======df.shape:\n",df.shape) #获取行和列
print("=======df.info():",df.info()) #查看具体的缺失数据
print("=======df.describe():\n",df.describe()) #查看具体的描述信息
print("=======查看前3行数据:\n",df.head(3)) #查看前几行数据
print("=======查看后3行数据:\n",df.tail(3)) #查看后几行数据

#2、查询,按行,按列,按照行和列查询
print("========df['端口名称']:\n",df['端口名称'])
print("========df.端口名称\n",df.端口名称)
print("========df.loc[0:3,:],前面是行,逗号后面是列:\n",df.loc[0:3,:])

print("=======按照行和列的区域查询\n",df.loc[0:3,"端口名称":"PhyStatus"]) #按照行和列的区域查询

print("=======查出特定的列,特定的行\n",df.loc[[0,3],["端口名称","LinkStatus"]])
#年龄>16的
print("=======年龄>45的:\n",df[df['age']>45])

#3、填充数据
#3.1 年龄填充最小值
age_min = df['age'].min()
df['age'] = df['age'].fillna(age_min)  #填充函数 fillna
print(df)
#3.2性别填充众数
mode=df['PhyStatus'].mode()
print(mode)
df['PhyStatus'] = df['PhyStatus'].fillna(mode)
print(df)

#4、将年龄按照升序排序后,保存到文本中
df = df.sort_values(by='age', ascending=False) #升序就是true
df.to_csv("new.csv",index=False)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值