Pythoy之 Pandas用法

Python之 pandas用法

# Pandas
首先,在介绍Pandas用法之前,我们先补充下Pandas的基本知识。在Python中,pandas是基于Numpy数组构建的,使数据预处理、清洗、分析工作变得更快更简单。pandas是专门为处理表格和混杂数据设计的,而Numpy更适合处理统一的数值数组数据。pandas有两个主要数据结构:Series和DataFrame。后续我会详细介绍pands的两个数据结构类型的使用。因此,在Python中引入pandas包的基本
语法格式为:

import pandas as pd

pandas–Series
同样,在介绍Series之前也先补充下相关知识点。Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(索引)组成,即index和values两部分,可以通过索引的方式选取Series中的单个或一组值。在创建Series之前,也有具体的格式规范:pd.Series(list,index=[ ]),其中第一个参数list可以是ndarry或者自己定义,第二个参数是index=[]是索引,默认情况是:在32位机器上,整数的位数为32位,取值范围为-2^31到2的31-1;64位系统上,整数的位数为64位,取值范围为-2的63到2的63-1;因此,第二个参数可以省略。

import pandas as pd,numpy as np
a=np.arange(10)
mySeries1=pd.Series(a) 
print(mySeries1)
输出结果:
0    0`
1    1
2    2
3    3
4    4
5    5
6    6
7    7
8    8
9    9

注意:这里用到np.arange()函数所以要先申明numpy as np
下面继续介绍Series的定义方法

import pandas as pd
mySeries1=pd.Series([11,12,13,14,15,16,17], index=["a","b","c","d","e","f","g"]) 
print(mySeries1)
输出结果:
a    11
b    12
c    13
d    14
e    15
f    16
g    17
dtype: int64

扩展下知识点:Series类型索引、切片、运算的操作类似于ndarray,同样的类似Python字典类型的操作,包括保留字in操作、使用.get()方法。Series和ndarray之间的主要区别在于Series之间的操作会根据索引自动对齐数据。

## DataFrame
DataFrame是一个表格型的数据类型,每列值类型可以不同,是最常用的pandas对象。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。因此,在Python中的格式定义pd.DataFrame(data,columns = [ ],index = [ ]):columns和index为指定的列、行索引,并按照顺序排列。

import numpy as np, pandas as pd
data = {'City': ['Chengdu', 'Changsha', 'Shanghai', 'Guangzhou', 'Beijiang'],
        'Year': [2000, 2001, 2002, 2001, 2002],
        'Pop':  [1.5, 1.7, 3.6, 2.4, 2.9]}
df= pd.DataFrame(data)
print(df)
输出结果:
 City  Year  Pop
0    Chengdu  2000  1.5
1   Changsha  2001  1.7
2   Shanghai  2002  3.6
3  Guangzhou  2001  2.4
4   Beijiang  2002  2.9

从上面的代码可知,data中的类型是可以自己定义的,那么我们可以采取一种对data中的数据随机获取吗?答案是可以的。具体定义如下:

import numpy as np, pandas as pd
df= pd.DataFrame(np.arange(10).reshape(2,5))
print(df)
输出结果:
   0  1  2  3  4
0  0  1  2  3  4
1  5  6  7  8  9
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值