NLP(12): Pandas_

最新推荐文章于 2023-12-25 16:26:49 发布

weixin_51182518

最新推荐文章于 2023-12-25 16:26:49 发布

阅读量238

点赞数

文章标签：数据结构列表数据分析

本文链接：https://blog.csdn.net/weixin_51182518/article/details/113773244

版权

本文详细介绍了Pandas中的Series和DataFrame数据结构，包括它们的创建、自定义索引、缺失数据处理、运算及排序。还讨论了层次化索引在数据处理中的应用，并介绍了如何使用Pandas读取CSV和Excel文件，以及利用matplotlib进行数据可视化。

摘要由CSDN通过智能技术生成

第一节初始Series

为什么学习pandas：
因为pandas含有使得数据分析工作变得更快和更简单的高级数据结构和操作工具
因为pandas时基于numpy来进行构建的，让以numpy为中心的应用变得更加的简单。

这个就是一直类似于一堆数组的对象，它是由一组数据以及一组与之相关的数据标签索引组成（索引）。仅由一组数据即可产生最简单的series。

obj=Series([1,2,3,4,5)
obj.values
obj.index

obj=Series(["a","b","c"],index=[1,2,3])
obj[1]: "a"

data={"a":10000,"b"":1000,"c"":2000}
obj=Series(data)
keys=["a","c"]
obj_1=Series(data,index=keys)#只取出字典中对应a和c的values

data={“a”:None,"b":20000}
obj=Series(data)
pd.isnull(obj)#判断是否为空
obj.isnull()

obj.name=""
obj.index.name=""

是一个表格型的数据结构，含有一组有序的列，每一列可以是不同值的数据类型，数值，布尔值，字符串都可以
dataframe既有行索引也有列索引

data={
	"60年代

关注