< <学习笔记>>
一.DataFrame常用属性
1.基本属性
函数 | 返回值 |
---|---|
values | 元素 |
index | 索引 |
columns | 列名 |
dtype | 数据类型 |
size | 元素个数 |
ndim | 维度数 |
shape | 数据形状 |
二.增删查改DataFrame
1.索引(用键值对形式)
# 例:
import pandas as pd
data = pd.read_csv(r'C:\Users\zqh\Desktop\Python数据分析与应用人邮版\data\meal_order_info.csv',encoding='gbk')
print(data.columns)
print(data[['info_id','dining_table_name']][:5])
"""
返回data‘info_id’和‘dining_table_name’列前5行数据
"""
2.查看访问DataFrame中数据
- 使用iloc和loc访问
- 1)loc方法:接收索引名称
DataFrame.loc[行索引名称,列索引名称] - 2)iloc方法:接收索引位置
DataFrame.iloc[行索引位置,列索引位置] - 注意:区间索引:iloc是前闭后开,loc是前后闭
3.更新数据
取出数据列进行赋值更新
4.增添一列数据
DataFrame添加一列,只需新建一个列索引,并对该索引下的数据赋值即可
5.删除某列或某行数据
- drop方法
pd.DataFrame.drop(labels,axis=0,level=None,inplace=False)
#例:
import pandas as pd
# data = pd.read_table(r'C:\Users\zqh\Desktop\Python数据分析与应用人邮版\data\meal_order_info.csv',sep=',',encoding='gbk')
# print(data)
data = pd.read_csv(r'C:\Users\zqh\Desktop\Python数据分析与应用人邮版\data\meal_order_info.csv',encoding='gbk')
print(data.columns)
print(data[['info_id','dining_table_name']][:5])
print(data.drop('info_id',axis=1).columns)
三.描述分析DataFrame数据
1.pandas描述性统计方法
方法 | 说明 |
---|---|
min | 最小值 |
man | 最大值 |
mean | 均值 |
median | 中位数 |
var | 方差 |
sem | 标准差 |
skem | 样本偏差 |
quantile | 四分位数 |
describe | 描述统计 |
ptp | 极差 |
std | 标准差 |
cov | 协方差 |
mode | 众数 |
kurt | 样本峰度 |
count | 非空值数目 |
mad | 平均绝对离差 |