数据分析工具Pandas

学习目标:

一,掌握 数据结构分析,索引操作及高级索引

二,掌握 算术运算与数据对齐,数据排序

三,掌握 统计计算与描述 ,层次化索引

四,掌握 读写数据操作


学习内容:

1.Pandas的数据结构分析

Series:类似一维数组的对象,它能够保存任何类型的数据,主要由一组数据和与之相关的索引两部分构成。

构造方法创建:

class pandas.Series(data = None,index = None,dtype = None, name = None,copy = False,fastpath = False)

# 创建Series类对象
ser_obj = pd.Series([1, 2, 3, 4, 5])

# 创建Series类对象,并指定索引
ser_obj = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])

#使用dict进行构建
year_data = {2001: 17.8, 2002: 20.1, 2003: 16.5} ser_obj2 = pd.Series(year_data)

# 获取ser_obj的索引
ser_obj.index

# 获取ser_obj的数据
ser_obj.values

# 获取位置索引3对应的数据
ser_obj[3]

DataFrame:是一个类似于二维数组或表格(如excel)的对象,它每列的数据可以是不同的数据类型。                               

DataFrame的索引不仅有行索引,还有列索引,数据可以有多列。

构造方法创建:

pandas.DataFrame(data = None,index = None,columns = None, dtype = None,copy = False )

# 创建数组
demo_arr = np.array([['a', 'b', 'c'],

                               ['d', 'e', 'f']])

# 基于数组创建DataFrame对象
df_obj = pd.DataFrame(demo_arr)

#按照指定索引的顺序进行排列
df_obj = pd.DataFrame(demo_arr, columns=['No1', 'No2', 'No3'])

# 通过列索引的方式获取一列数据
element = df_obj['No2']

# 查看返回结果的类型
type(element)

# 通过属性获取列数据
element = df_obj.No2

# 查看返回结果的类型
type(element)

# 增加No4一列数据
df_obj['No4'] = ['g', 'h']

# 删除No3一列数据
del df_obj['No3']


  2.Pandas索引操作及高级索引

 Pandas中的索引都是Index类对象,又称为索引对象,该对象是不可以进行修改的,以保障数据的安全。

 Pandas还提供了很多Index的子类,常见的有如下几种:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TGKD DFN

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值