【MOOC】Python数据分析与展示-北京理工大学-【第三周】数据分析之概要

本篇博客详细介绍了Python数据分析库pandas的使用,包括Series和DataFrame两种核心数据类型,以及数据操作如重新索引、删除、运算等。讲解了如何利用pandas进行数据排序、统计分析和相关性分析,适合初学者掌握pandas进行数据处理。
摘要由CSDN通过智能技术生成

概要:提取数据的基本特征

这里写图片描述

单元7:pandas库入门

更多参考:http://pandas.pydata.org/

Pandas是Python第三方库,提供高性能易用数据类型和分析工具,Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用。

常用引用方法:

import pandas as pd

7.1对pandas库的理解

与numpy的区别
这里写图片描述

该库基于numpy提供了两个新的数据类型:Series, DataFrame

基于上述数据类型有各类操作:基本操作、运算操作、特征类操作、关联类操作

7.2 Series类型(一维)

Series类型由一组数据及与之相关的数据索引组成

这里写图片描述

实例1:
这里写图片描述

实例2:
这里写图片描述

Series类型可以由如下类型创建:
• Python列表,index与列表元素个数一致
• 标量值,index表达Series类型的尺寸
• Python字典,键值对中的“键”是索引,index从字典中进行选择操作
• ndarray,索引和数据都可以通过ndarray类型创建
• 其他函数,range()函数等

实例:
这里写图片描述
这里写图片描述
这里写图片描述

如何理解该类型

Series是一维带“标签”数组(Series类型包括index和values两部分)

index_0 —–> data_a**(索引 与 值 一一对应)**

Series基本操作类似ndarray和字典,根据索引对齐进行运算(而不是像numpy一般基于维度进行运算)

Series类型的基本操作

  1. 使用 .index 获取索引,使用 .value 获取数据
    这里写图片描述

2.自动索引 与 自定义索引并存(但不能混合使用

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值