pandas库学习记录
在接触了一点python的数据分析后,发现有一个众人很推崇的pandas库。据说,与numpy结合能够实现许多强大的使数据分析功能。但其实在接触一段时间之后,我发现,还是很难掌握这个库的精髓。为了避免长时间遗忘,我把这一系列实践记录下来。
- 引用
import pandas
一般都写作:
import pandas as pd
- Series
引用
from pandas import Series
输入:
s1=Series([1,2,3,4])
输出:
0 1 1 2 2 3 3 4
生成序列时的可选关键字:index
在生成Series时,这样写
s2=Series([1,2,3,4],index=[a,b,c,d])
则s2的索引index会变成a、b、c、d。
[a,b,c,d]也可由其他list类型的变量代替。
同时Series也可以吸收字典变量
sdata={'a':1,'b':2,'c':3,'d':4}s3=Series(sdata)
s3输出
- DataFrame
d=DataFrame(data,index,columns)