python(七)数据分析之pandas

一、功能定位

1、什么是pandas?

pandas,python+data+analysis的组合缩写,是python中基于numpy和matplotlib的第三方数据分析库,与后两者共同构成了python数据分析的基础工具包,享有数分三剑客之名。

2、pandas用来作什么?

pandas主要用于数据处理与分析,支持包括数据读写、数值计算、数据处理、数据分析和数据可视化全套流程操作。

二、数据结构

pandas的核心数据结构是一维的series和二维的dataframe
在这里插入图片描述

1、dataframe

dataframe参考资料

2、索引操作

2.1 Series索引

import pandas as pd

ser_obj = pd.Series(range(1,6), index = ['a','b', 'c', 'd', 'e'])
print(ser_obj.head())

print('*'*10,'行索引','*'*10)
print(ser_obj['b'])
print(ser_obj[3])

print('*'*10,'切片索引','*'*10)#注意,按索引名切片操作时,是包含终止索引的。
print(ser_obj[1:3])
print(ser_obj['b':'d'])

print('*'*10,'不连续索引','*'*10)
print(ser_obj[[0, 2, 4]])
print(ser_obj[['a', 'e']])

print('*'*10,'布尔索引','*'*10)
ser_bool = ser_obj > 2
print(ser_bool)
print(ser_obj[ser_bool])
print(ser_obj[ser_obj > 2])

在这里插入图片描述

2.2 DataFrame索引

import pandas as pd
import numpy as np

df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])
print(df_obj.head())

print('*'*10,'列索引','*'*10)
print(df_obj['a']) # 返回Series类型

print('*'*10,'不连续索引','*'*10)
print(df_obj[['a','c']])

print('*'*10,'高级索引:标签、位置和混合','*'*10)
print('*'*10,'标签索引 loc','*'*10)#第一个参数索引行,第二个参数是列
print(df_obj.loc[0:2, 'a'])

print('*'*10,'iloc 位置索引','*'*10)
print(df_obj.iloc[0:2, 0]) # 注意和df_obj.loc[0:2, 'a']的区别

print('*'*10,'ix 标签与位置混合索引','*'*10)
print(df_obj.ix[
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值