Python - pandas库的使用

pandas简介

Numpy在向量化的数值计算中优势明显,但是在处理较为复杂的数据,例如标签化的数据中表现力不从心,而基于Numpy库进行开发的Pandas提供了使得数据分析变得更简单的高级数据结构和操作工具。
由于pandas基于Numpy开发,所以pandas的向量化和矩阵运算与numpy基本相同。
但是对于纯粹的计算,Numpy要比pandas更加快速。

调用方法

import pandas as pd

关于pd.Series

Series是带有标签数据的一维数组。

创建series对象

pd.Series(data,index=,dtype)
# data可以是列表,字典或np数组, index是索引,为可选参数,dtype同

  1. 通过列表创建
>>> a = pd.Series([1,2,3,4])
>>> a
0    1
1    2
2    3
3    4
dtype: int64
# 数据为标量的时候
>>> a = pd.Series(1,index=['a','b'])
>>> a
a    1
b    1
dtype: int64
  1. 通过np数组创建

>>> a = pd.Series(np.arange(4),index=['a','b','c','d'])
>>> a
a    1
b    2
c    3
d    4
dtype: int32
>>> a['a']
1
  1. 通过字典创建
>>> dict = {
   'a':1,'b':2,'c':3,'d':4}
>>> pd.Series(dict,index=['a','b','c','d','e'])	# 如果有指定标签,那么会根据index以及字典的key进行比对,比对成功则输出,没有找到输出NaN。
a    1.0
b    2.0
c    3.0
d    4.0
e    NaN
dtype: float64

关于pd.DataFrame

DataFrame是带有标签的多维数组

创建DaraFrame对象

pd.DataFrame(data, index=, columns=)	# columns为列标签,可选参数!
  1. 通过Series对象创建
>>> a
a    1
b    2
c    3
d    4
dtype: int64
>>> pd.DataFrame(a, columns = ["num"])
   num
a    1
b    2
c    3
d    4
  1. 通过字典对象进行创建
>>> dict
{
   'a': [1, 2, 3], 'b': [4, 5, 6], 'c': 3, 'd': 
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值