一.创建数据
import pandas as pd
import numpy as np
# 生成6*4数据集
data = pd.DataFrame(np.random.rand(6,4), columns=list('ABCD'))
# 创建时间索引
date = pd.date_range('20180101', periods=6)
# 再创建6*4数据集
df1 = pd.DataFrame(np.random.randn(6,4),index=date,columns=list('ABCD'))
# 使用字典创建数据
df2 = pd.DataFrame({"A":np.random.randn(3)})
print(df2)
# 另一种字典创建数据集的方法
df3 = pd.DataFrame({'A':pd.Timestamp('20180101'),'B':np.random.randn(3)})
print(df3)
运行结果
二.查看数据
1.使用dtypes查看数据格式
df3.dtypes
2.查看所有数据
df3
3.使用head查看前几行数据,默认5行
df1.head()
4.使用tail查看后几行数据,默认5行
df1.tail()
5.查看数据索引
df1.index
6.columns查看列名
df1.columns
7.values查看数据值
df1.values
8.describe查看描述性统计
df1.describe()
9.T转置
df1.T
10.sort_values对数据排序
df1.sort_values(by='C')
运行结果如下