Day47 Pandas数据分析

Tian-Ys

已于 2022-03-30 20:54:43 修改

阅读量3k

点赞数

分类专栏：笔记文章标签： python

于 2022-03-27 22:54:12 首次发布

本文链接：https://blog.csdn.net/m0_64350718/article/details/123780035

版权

这篇博客详细介绍了Pandas的使用，包括如何下载和安装，Series和DataFrame的创建、删除与获取操作，文件读写，Jupyter Notebook的运用，Seaborn可视化，以及数据清洗技巧。重点讲解了如何处理缺失数据、数据类型转换和数据切分等问题，同时展示了如何将数据写入MySQL数据库。

摘要由CSDN通过智能技术生成

Pandas的下载

控制台中输入命令：pip install pandas进行下载pandas

pandas下载成功后，会出现上述界面

pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数

pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理功能

Series

Series是一种类似于一维数组的对象，由数据(各种NumPy数据类型)以及与之相关的数据标签(即索引)组成

可以通过字典构建Series对象，Series对象的索引也是可以修改的

举例：

import pandas as pd

data = [1, 2, 3]
series1 = pd.Series(data=data)
print(series1, type(series1))
# 获取下标为0的数据
print(series1[0])
print(">" * 70)
# 通过字典创建series
data1 = {1: "java", 2: "python", 3: "scala"}
series2 = pd.Series(data=data1)
print(series2, type(series2))
# 根据key值进行获取数据
print("根据key值获取数据:"+series2[2])
print(">" * 70)
# 创建series给定下标 根据给定key值进行创建
series3=pd.Series(data=data1, index=[2, 3])
print(series3)

结果：

相关函数：获取最大值与获取最小值：series1.max();series1.min()

结果：

DataFrame

DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型(数值、字符串、布尔值等)

DataFrame既有行索引也有列索引，可以看做由Series组成的字典

DataFrame的创建

DataFrame的创建可以通过字典创建，也可以通过列表创建，在使用列表创建时，默认情况下输出的列名称为数字顺序，可以在创建时加入设置列名称：columns=... ...

# 创建dataframe,通过字典创建
data2 = {
    "Language": ["Python", "java", "scala", "sql"],
    "application": ["pyspark", "hadoop", "spark", "hive"]
}
df = pd.DataFrame(data=data2)
print(df)
# 通过列表创建,可以增加列名称
data3 = [["java", "1"], ["Python", "2"], ["scala", "3"]]
df2 = pd.DataFrame(data=data3, columns=["Language", "Number"])
print(df2)

结果：

当dataframe中只有一列数据时，仍然表示的是一个dataframe，而不是series

data4=[[10],[20],[30]]
df3=pd.DataFrame(data4)
print(df3,type(df3))

删除操作：

使用Drop方法进行删除操作

格式：DataFrame.drop(labels=["行/列名称"]，axis=0:表示行/1:表示列)

当想要进行删除操作时，需要指定删除的是行数据还是列数据

这里的指定有一个变量axis，若在进行删除操作时，不加axis的值，axis默认为0，表示删除行数据

但是这里进行删除后的dataframe是一个新的dataframe，若想使被删除的原dataframe在删除后变为删除后的表，需要使用inplace方法进行替换

格式：DataFrame.drop(labels=["行/列名称"]，axis=0:表示行/1:表示列，inplace=True)

这里的inplace默认为False

# 删除df2

最低0.47元/天解锁文章

Tian-Ys

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Day47 Pandas数据分析

Pandas的下载控制台中输入命令：pip install pandas进行下载pandaspandas下载成功后，会出现上述界面pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理功能SeriesSeries是一种类似于一维数组的对象，由数据(各种NumPy数据类型)以及与之相关的数据标签(即索引)组成可以通过字典构建Series对象，Series对象的索引也是可以修改的
复制链接

扫一扫