DataFrame学习笔记

DataFrame = 行列索引 +二维数据
1.由字典创建

data={'name':['wangdachui','Linling','Niuyun'],'pay':[4000,5000,6000]}
labels = ['a','b','c']
df = pd.DataFrame(data,index = labels)

2.由array创建

data=np.array([('wangdachui','4000'),('Linling','5000'),('Niuyun','6000')]) #分别对应第一行,第二行,第三行
df = pd.DataFrame(data,index=range(1,4),columns=['name','pay'])

3.DataFrame常用函数

df.index #行名索引
df.columns #列名索引
df.values 
df.dtypes #查看数据类型,object是字符串型
df.head(x) #查看前x行,不填则默认为5
df.tail(x) #查看后x行
df.describe() #查看统计数据
df.T #转置
df.isnull() #判断dataframe中元素是否为空,若为空则返回true
df.mean() #求均值
df['age'].sum() #对age该列求和

4.对DataFrame进行排序

df.sort_values(by = 'age') #按age升序排

5.切片

df[1:3] #即1,2行,不含3,从0开始

6.通过标签查询单列或多列

df['age']
df[['age','animal']] #注意是两个中括号

7.通过位置查询和更改

df.iloc[1:3] #查询1,2,两行,不含3行,从0开始
df.iloc[:3,1] #前行后列
df.iat[1,0] = 2 #把1行0列的元素值改为2
df.loc['f','age'] = 1.5 #根据行名和列名定位进行修改

8.副本拷贝

df2=df1.copy()

9.添加列数据

num = pd.Series([0,1,2,3,4])
df['NO.'] = num  #添加以No.为列名的新数据列

10.字符串

string = pd.Series(['A','b','C','Abcd'])
print(string)
string.str.lower() #转换为全小写
string.str.upper() #转换为全大写

11.缺失值操作

df.finllna(value=3) #对NaN值填充为3

12.删除存在缺失值的行

df.dropna(how = 'any') #任何存在NaN的行都将被删除

热力图

参考文档

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

data = {'name': [200, 300, 400], 'pay': [400, 500, 600]}
labels = ['0.1N', '0.2N', '0.3N']
df = pd.DataFrame(data, index=labels)

sns.heatmap(df, vmin=0, vmax=600)
plt.show()

在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值