开始学习了pandas的基本操作与基本数据形式。
-
基本的序列
import pandas as pd
import numpy as np
# 基本的序列
s = pd.Series([1, 3, 6, np.nan, 44, 1], index=[1, 2, 3 ,4, 5, 6])
print(s)
#result
1 1.0
2 3.0
3 6.0
4 NaN
5 44.0
6 1.0
dtype: float64
-
日期形式
# 日期
dates = pd.date_range('20160101', periods= 6)
print(dates)
# 数据流的格式 DataFrame(Data, index, columns) index是索引行, columns是 列标
df = pd.DataFrame(np.arange(24).reshape(6, 4), index = dates,
columns = ['a', 'b', 'c', 'd'])
print(df)
#result
DatetimeIndex(['2016-01-01', '2016-01-02', '2016-01-03', '2016-01-04',
'2016-01-05', '2016-01-06'],
dtype='datetime64[ns]', freq='D')
a b c d
2016-01-01 0 1 2 3
2016-01-02 4 5 6 7
2016-01-03 8 9 10 11
2016-01-04 12 13 14 15
2016-01-05 16 17 18 19
2016-01-06 20 21 22 23