第一节 初始Series
为什么学习pandas:
因为pandas含有使得数据分析工作变得更快和更简单的高级数据结构和操作工具
因为pandas时基于numpy来进行构建的,让以numpy为中心的应用变得更加的简单。
1、Series类型说明
这个就是一直类似于一堆数组的对象,它是由一组数据以及一组与之相关的数据标签索引组成(索引)。仅由一组数据即可产生最简单的series。
obj=Series([1,2,3,4,5)
obj.values
obj.index
2、自定义索引
obj=Series(["a","b","c"],index=[1,2,3])
obj[1]: "a"
3、series可以当作字典使用
data={"a":10000,"b"":1000,"c"":2000}
obj=Series(data)
keys=["a","c"]
obj_1=Series(data,index=keys)#只取出字典中对应a和c的values
4、对缺失数据的处理
data={“a”:None,"b":20000}
obj=Series(data)
pd.isnull(obj)#判断是否为空
obj.isnull()
5、指定series name和index name
obj.name=""
obj.index.name=""
第二节:初始Dataframe
是一个表格型的数据结构,含有一组有序的列,每一列可以是不同值的数据类型,数值,布尔值,字符串都可以
dataframe既有行索引也有列索引
1、构建一个dataframe
data={
"60年代