数据分析pandas 基础介绍

本文介绍了pandas,一个基于NumPy的数据分析库,它提供了高效的数据结构和数据分析工具。pandas支持处理异构数据,包含Series和DataFrame两种主要数据结构。与numpy相比,pandas更专注于数据处理和分析,支持数据读写、统计计算、数据清洗等功能。文章还详细讲述了pandas的使用步骤,包括数据导入、基本操作、查询、替换、缺失值处理等。
摘要由CSDN通过智能技术生成

文章目录

 

  1.  数据分析三巨头 Numpy、Pandas、Matplotlib


前言

pandas 是Python data analysis 的缩写,是基于Numpy和matplotlib的数据分析库,pandas是在numpy的基础上实现的,所有pandas与numpy有一定的相似之处。


一、pandas是什么?

1、pandas介绍

        pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建。Pandas 是 Python (opens new window)的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。      

        pandas 适用于处理以下类型的数据:

  • 与 SQL 或 Excel 表类似的,含异构列的表格数据;
  • 有序和无序(非固定频率)的时间序列数据;
  • 带行列标签的矩阵数据,包括同构或异构型数据;
  • 任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。

        Pandas 的主要数据结构是 Series (opens new window)(一维数据)与 DataFrame (opens new window)(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。对于 R 用户,DataFrame 提供了比 R 语言 data.frame 更丰富的功能。Pandas 基于 NumPy (opens new window)开发,可以与其它第三方科学计算支持库完美集成。

        Pandas 就像一把万能瑞士军刀,下面仅列出了它的部分优势 :

  • 处理浮点与非浮点数据里的缺失数据,表示为 NaN
  • 大小可变:插入或删除 DataFrame 等多维对象的列;
  • 自动、显式数据对齐:显式地将对象与一组标签对齐,也可以忽略标签,在 Series、DataFrame 计算时自动与数据对齐;
  • 强大、灵活的分组(group by)功能:<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值