python数据清洗 -pandas库

最新推荐文章于 2024-04-28 17:22:19 发布

钢筋工

最新推荐文章于 2024-04-28 17:22:19 发布

阅读量632

点赞数

分类专栏：机器学习文章标签： Pthon Pandas基础

本文链接：https://blog.csdn.net/ww08153115/article/details/102545763

版权

文章目录

1. pandas简介
2. Series
3.DataFrame

1. pandas简介

Pandas是基于Numpy的数据分析包,内核是Numpy
加粗样式 Pandas通常是用于数据分析过程中, 数据的清洗, 数据预处理, 数据的描述性分析等过程中.
在整个Python数据分析的生态环境中, Pandas的地位非常重要, 利用Pandas可以快速便捷的对数据进行各种各样的处理与操作.
Pandas的名称来自于面板数据（panel data）和python数据分析（data analysis）。
在Pandas中, 最重要的两种数据结构是1维的Series和2维的DataFrame.
Series：一维数组，与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。
Series中能保存不同种数据类型，字符串、boolean值、数字等都能保存在Series中。但是每个Series中只能保存一种数据结构.
DataFrame：二维的表格型数据结构。有多个Series共同构成的集合就变成DataFrame.