《利用python进行数据分析》笔记三（pandas）

最新推荐文章于 2024-04-13 08:34:11 发布

chucksonwheel

最新推荐文章于 2024-04-13 08:34:11 发布

阅读量268

点赞数

分类专栏：学习笔记数据分析 python

本文链接：https://blog.csdn.net/chucksonwheel/article/details/79540964

版权

16 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

from pandas import Series,DataFrame
import pandas as pd

1 Series
一种类似于一维数组的对象，由一组数据（numpy中的各种数据类型）和一组对应的数据标签（索引）组成

data1=series([1,2,3,5])
data2=series([1,3,5,7],index=['a','b','c','d'])
data1.values
data1.index

numpy数组的运算都会保留值与索引间的链接
由于series是索引到值的一个映射，所以也可以看作是定长的有序字典
series最重要的一个功能是：在算术运算中自动对齐不同索引的值
series的表头：

data1.name
data1.index.name

表头和索引都可以通过赋值来更改

2 DataFrame
类似于表格的数据类型，含有一组有序的列，每一列的数据类型可以不同
既有行索引，又有列索引，可以看做series组成的字典

创建：
先创建一个字典，再导入dataframe

data={'data1':[d1,d2,d3],
      'data2':[d4,d5,d6]}
data1=DataFrame(data)

取出某行：frame.loc['row_name']
取出某列：frame['column_name']
删除某列：del frame['column_name']
表格转置：frame.T
dataframe输入

index对象不可修改

index方法和属性

重索引，并插值

frame.reindex(['index1','index2'],fill_value=0)#对行
frame.reindex(columns=['index1','index2'])#对列

reindex参数
method选项

*插值只能对行

关注