import pandas as pd
import numpy as np
# Numpy 和 Pandas 有什么不同
# 如果用 python 的列表和字典来作比较, 那么可以说 Numpy 是列表形式的,没有数值标签,而 Pandas 就是字典形式。Pandas是基于Numpy构建的,让Numpy为中心的应用变得更加简单。
# 要使用pandas,首先需要了解他主要两个数据结构:Series和DataFrame。
# Series:Series的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引。于是会自动创建一个0到N-1(N为长度)的整数型索引。
s = pd.Series([1, 3, 6, np.nan, 44, 1])
print(s)
# DataFrame:DataFrame是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值等)。DataFrame既有行索引也有列索引, 它可以被看做由Series组成的大字典。
data = pd.date_range('20160101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=data, columns=['a', 'b', 'c', 'd'])
print(df)
# DataFrame简单使用
print(df['b'])
# 默认的从0开始 index
df1 = pd.DataFrame(np.arange(12).reshape((3, 4)))
print(df1)
df2 = pd.DataFrame({'A': 1,
'B': pd.Timestamp('20130102'),
'C': pd.Series(1, index=list(range(4)), dtype='float32'),
'D': np.array([3] * 4, dtype='int32'),
'E': pd.Categorical(['test', 'train', 'test', 'train']),
'F': 'foo'
})
print(df2)
print(df2.dtypes) # 数据中的类型
print(df2.index) # 对列的序号
print(df2.values) # 看所有df2的值
# 想知道数据的总结, 可以用 describe():
print(df2.describe())
# 翻转数据
print(df2.transpose())
# 对数据的 index 进行排序并输出 ascending为True代表正序
print(df2.sort_index(axis=1,ascending=True))
# 对数据 值 排序输出
print(df2.sort_values(by='E'))
pandas基本操作
最新推荐文章于 2024-02-04 11:05:13 发布