总览
1 DataFrame() 创建一个DataFrame对象
2 df.values 返回ndarray类型的对象
3 df.index 获取行索引
4 df.columns 获取列索引
5 df.axes 获取行及列索引
6 df.T 行与列对调
7 df. info() 打印DataFrame对象的信息
8 df.head(i) 显示前 i 行数据
9 df.tail(i) 显示后 i 行数据
10 df.describe() 查看数据按列的统计信息
新建dataframe
dataframe相当于numpy中的二维数据
# 新建
import pandas as pd
a = pd.DataFrame([[1,2,3],
[4,5,6],
[7,8,9]],columns = ["feature_1", "feature_2", "label"])
# 效果
feature_1 feature_2 label
0 1 2 3
1 4 5 6
2 7 8 9
# 读取
import pandas as pd
df = pd.read_csv("datas/hour.csv", sep=",")
# 读取csv结尾的文件,以逗号作为分割符
删除dataframe列及修改列名
# 删除列名所指的列
del df["列名"]
df.drop(columns=["列名1","列名2"])
# 修改列名
# 暴力修改
a.columns = ['a','b','c']
# 较好的方法(以字典的形式对应替换)
a.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace = True)
查看字段信息
# 查看信息
a.info()