pandas入门

目录

1.导入pandas

2.pandas两个常用的工具数据结构——Series和DataFrame

2.1. Series

2.2. DataFrame

2.2.1 构建dataframe

2.2.2 DataFrame中的一列,可以按字典型标记或属性那样检索为Series;

2.2.3 将列表或数组赋值给一个列

2.2.4 删除一个列

 ​

2.2.5 返回DataFrame的values属性(以二维ndarray的形式返回)

2.2.6 索引对象

 2.2.7 Series或者DataFrame的索引

 2.2.8 使用loc和iloc选择数据

2.2.9 使用填充值的算数方法

2.2.10 DataFrame和Series间的操作

2.2.11 函数应用和映射 

 2.2.12 排序和排名

2.2.13 唯一值,计数和成员属性


pandas——进行数据清洗和分析(适合处理表格或异质型数据)

numpy——数值计算工具(适合处理同质型的数值类数组数据)

matplotlib——数据可视化工具

1.导入pandas

import pandas as pd

2.pandas两个常用的工具数据结构——Series和DataFrame

2.1. Series

Series:一种一维的数组型对象,它包含了一个值序列,并包含了数据标签,称为索引(index)。

不为数据指定索引默认生成的索引是从0-N-1(N是数据的长度)

另一个角度将series考虑成长度固定且有序的字典。所以可以用已存在的字典生成一个series

2.1.1创建series

obj = pd.Series(range(3,10,2))

# 输出:
0    3
1    5
2    7
3    9
dtype: int64

sdata = {'Alice':80,'Bob':88,'Sherry':93}
# 根据已有字典生成一个series
new_sdata = pd.Series(sdata)
# 输出:
Alice     80
Bob       88
Sherry    93
dtype: int64

2.1.2 取series的值values和索引index

obj.values
/* 输出:
    array([3, 5, 7, 9], dtype=int64)
*/
obj.index
/* 输出:
    RangeIndex(start=0, stop=4, step=1)
*/

2.1.3 生成series用修改index将新的series以修改后的index顺序排序

names = ['Bob','Sherry','Alice']
new_sdata_names = pd.Series(sdata,index=names)

# 输出:

Bob       88
Sherry    93
Alice     80
dtype:
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值