Pandas学习day-01
导入Pandas
import pandas as pd
import numpy as np
Pandas基本数据结构
pandas中有两种基本结构
Series
一维数组,与numpy中得array类似,与python中的基本数据结构List也相近。Series能保存不同的数据类型。
DataFrame
二维的表格型数据结构。
Pandas的Series类型
一维Series可以用一维列表初始化
s=pd.Series([1,3,5,np.nan,6,8])
s
0 1.0
1 3.0
2 5.0
3 NaN
4 6.0
5 8.0
dtype: float64
s=pd.Series([1,3,5,np.nan,6,8],index=['a','b','c','d','e','f'])
s
a 1.0
b 3.0
c 5.0
d NaN
e 6.0
f 8.0
dtype: float64
索引数据的行标签
s.index
Index(['a', 'b', 'c', 'd', 'e', 'f'], dtype='object')
值
s.values
array([ 1., 3., 5., nan, 6., 8.])
s[0]
1.0
s[3]
nan
切片操作
s[2:5]
c 5.0
d NaN
e 6.0
dtype: float64
s[::2]
a 1.0
c 5.0
e 6.0
dtype: float64
索引赋值
s.index.name='索引'
s
索引
a 1.0
b 3.0
c 5.0
d NaN
e 6.0
f 8.0
dtype: float64
pandas的DataFrame类型
构造一个时间序列
date=pd.date_range('20180101',periods=6)
date
DatetimeIndex(['2018-01-01', '2018-01-02', '2018-01-03', '2018-01-04',
'2018-01-05', '2018-01-06'],
dtype='datetime64[ns]', freq='D')
传入二维数组
df=pd.DataFrame(np.random.randn(6,4),index=date,columns=list('ABCD'))
df
A | B | C | D | |
---|---|---|---|---|
2018-01-01 | 0.276367 | 0.235869 | -0.863373 | 0.785798 |
2018-01-02 | -0.585890 | 0.142942 | -0.504779 | -1.370040 |
2018-01-03 | -0.607308 | -0.983548 | 0.310815 | 0.338497 |
2018-01-04 | 0.025879 | -0.442640 | -0.862432 | 1.204614 |
2018-01-05 | -0.278121 | 0.272711 | 0.491046 | -0.114447 |
2018-01-06 | -0.042118 | -0.761489 | -2.086405 | -0.566671 |
使用字典传入数据
df2=pd.DataFrame({
'A':1,
'B'