3-1 pandas的数据结构


Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一
(1) 一个强大的分析和操作大型结构化数据集所需的工具集
(2) 基础是NumPy,提供了高性能矩阵的运算
(3) 提供了大量能够快速便捷地处理数据的函数和方法
(4)应用于数据挖掘,数据分析
(5)提供数据清洗功能

1. Pandas的数据结构

Pandas有两个最主要也是最重要的数据结构:SeriesDataFrame

1.1 Series

1.1.1 Series介绍

Series是一种一维标记的数组型对象,能够保存任何数据类型(int,str,float,python object…),包含了数据标签,称为索引
(1)类似一维数组的对象1,index=[‘名字’,‘年龄’,‘班级’]
(2)由数据索引组成

  • 索引(index)在左,数据(values)在右
  • 索引是自动创建的
    在这里插入图片描述

1.1.2 Series创建

创建Series的三种方式:

  1. 通过list创建
import pandas as pd
import numpy as np
#1. 通过list创建
s1 = pd.Series([1,2,3,4,5])
#结果为RangeIndex(start=0, stop=5, step=1)
print(s1.index)
#结果为[1 2 3 4 5]
print(s1.values)
#结果为:
#0    1
#1    2
#2    3
#3    4
#4    5
s1
#结果为:pandas.core.series.Series
type(s1)
  1. 通过numpy数组创建
#2. 通过numpy数组创建
#创建数组
arr1 = np.arange(1,6)
s2 = pd.Series(arr1)
#结果为:
#0    1
#1    2
#2    3
#3    4
#4    5
s2
#指定索引 索引长度和数据长度必须相同
s2 = pd.Series(arr1,index=['a','b','c','d','e'])
#结果为:
#a    1
#b    2
#c    3
#d    4
#e    5
s2
  1. 通过字典创建
#3. 通过字典创建
#创建字典
dict = {
   'name':'李宁','age':18,'class':'三班'}
s3 = pd.Series(dict)
#结果为:
#name     李宁
#age      18
#class    三班
s3
#规定索引按顺序输出
s3 = pd.Series(dict,index=['name',
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值