【pandas学习笔记(一)】pandas基本使用

pandas简介

pandas是一个基于numpy的数据处理库,其主要的用途为数据分析及其处理,特别是序列及表格数据

引入pandas库

>>> import numpy as np
>>> import pandas as pd

pandas库经常与numpy库一起配合使用

创建序列

创建序列的方法主要有三种:创建一维数组,创建字典以及提取DataFrame中的某一列

我们先来看第一种方法,通过一维数组创建序列:

>>> arr1 = np.array([1,3,2,5,6,10,7])
>>> s1 =pd.Series(arr1)
>>> print(s1)

输出结果为:

0     1
1     3
2     2
3     5
4     6
5    10
6     7
dtype: int32

第二种方法,通过字典创建序列:

>>> dic1 = {
   '高數成績':90,'綫代成績':85,'外語成績':80,'工圖成績':86}
>>> s2 = pd.Series(dic1)
>>> print(s2)

输出结果为:

高數成績    90
綫代成績    85
外語成績    80
工圖成績    86
dtype: int64

第三种方法在后面将与DataFrame创建并结合实例讲解

小结:不管是通过数组还是通过字典创建Series,都要用Series方法将数据转化为Series,其格式为

pd.Series(arr) 
# 或者是
pd.Series(dic)

# 其中,arr代表一維數組,dic代表字典

DataFrame创建

创建DataFrame主要也是有两种方式:二维数组及字典,本文所讲解的实例中,将使用字典的方式创建DataFrame

在这里将略带过下通过二维数组创建DataFrame:

# 假設arr_2D為二維數組
df = pd.DataFrame(arr_2D)

输出的结果中,标签(横着的属性)及索引(竖着的属性)都是自然数(0,1,2,3…)

我们在开始介绍第二种方法前,我先简要介绍下我们的将要引入的实例:

G7全称为七国集团,是一个由世界七大发达经济体所组成的国际组织,其成员国分别为美国、加拿大、英国、法国、德国、意大利及日本。下面,我们将各个成员国的面积,人口,国内生产总值(GDP),基尼系数,人类发展指数以及其使用的货币创建为DataFrame,并在此DataFrame的基础上进行讲解

首先,我们先创建一个嵌套字典

'''通過字典嵌套建立數據框(DataFrame)'''

G7_dic = {
   '面積': {
   
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值