Python 教程之数据分析(4)—— 使用 Python 进行数据分析和可视化

Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。Pandas 就是其中之一,它使导入和分析数据变得更加容易。在本文中,我使用 Pandas 分析了来自流行的“statweb.stanford.edu”网站的联合国公共数据集的 Country Data.csv 文件中的数据。在分析印度国家数据时,我介绍了 Pandas 的关键概念如下。在阅读本文之前,请大致了解 matplotlib 和 csv 的基础知识。

安装 pandas 最简单的方法是使用 pip:

pip install pandas

在 Pandas 中创建数据框

数据框的创建是通过使用 pd.Series 方法将多个系列传递给 DataFrame 类来完成的。在这里,它传入两个 Series 对象,s1 作为第一行,s2 作为第二行。例子:

# 将两个系列分配给 s1 和 s2s1 = pd.Series([1,2])s2 = pd.Series(["Ashish", "Sid"])# 将系列对象构建为数据df = pd.DataFrame([s1,s2])# 显示数据框df# 以另一种方式获取索引和列值的数据框架dframe = pd.DataFrame([[1,2],["Ashish", "Sid"]],		index=["r1", "r2"],		columns=["c1", "c2"])dframe# 以另一种方式构建类似字典的容器dframe = pd.DataFrame({		"c1": [1, "Ashish"],		"c2": [2, "Sid"]})dframe

复制代码

输出:

img

img

img

使用 Pandas 导入数据

第一步是读取数据。数据存储为逗号分隔值或 csv 文件,其中每一行由新行分隔,每一列由逗号 (,) 分隔。为了能够在 Python 中处理数据,需要将 csv 文件读入 Pandas DataFrame。DataFrame 是一种表示和处理表格数据的方法。表格数据有行和列,就像这个csv 文件一样(点击下载)。例子:

# 导入pandas库,重命名为pdimport pandas as pd# 将 IND_data.csv 读入 DataFrame,分配给 dfdf = pd.read_csv("IND_data.csv")# 默认打印 DataFrame 的前 5 行df.head()# 打印编号 DataFrame 的行数和列数df.shape

复制代码

输出:

img

29,10

复制代码

使用 Pandas 索引 DataFrame

可以使用 pandas.DataFrame.iloc 方法进行索引。iloc 方法允许按位置检索尽可能多的行和列。例子:

# 打印前 5 行和复制 df.head() 的每一列df.iloc[0:5,:]# 打印整行和整列df.iloc[:,:]# 从第 5 行和前 5 列打印df.iloc[5:,:5]

复制代码

在 Pandas 中使用标签进行索引

可以使用 pandas.DataFrame.loc 方法对标签进行索引,该方法允许使用标签而不是位置进行索引。例子:

# 打印前五行,包括第 5 个索引和 df 的每一列df.loc[0:5,:]# 从第 5 行开始打印整列df = df.loc[5:,:]

复制代码

上面的内容实际上看起来与 df.iloc[0:5,:] 没有太大区别。这是因为虽然行标签可以采用任何值,但我们的行标签与位置完全匹配。但是在处理数据时,列标签可以让事情变得更容易。例子:

# 打印前 5 行时间段值df.loc[:5,"Time period"]

复制代码

img

使用 Pandas 进行 DataFrame 数学运算

数据帧的计算可以使用 pandas 工具的统计函数来完成。例子:

# 计算各种汇总统计信息,不包括 NaN 值df.describe()# 用于计算相关性df.corr()# 计算数值数据等级df.rank()

复制代码

img

img

img

熊猫绘图

这些示例中的绘图是使用引用 matplotlib API 的标准约定制作的,该 API 提供了 pandas 的基础知识,可以轻松创建美观的绘图。例子:

# 导入需要的模块import matplotlib.pyplot as plt# 绘制直方图df['Observation Value'].hist(bins=10)# 显示存在大量异常值/极值df.boxplot(column='Observation Value', by = 'Time period')# 将点绘制为散点图x = df["Observation Value"]y = df["Time period"]plt.scatter(x, y, label= "stars", color= "m",			marker= "*", s=30)# x 轴标签plt.xlabel('Observation Value')# 频率标签plt.ylabel('Time period')# 显示绘图的功能plt.show()

复制代码

img

img

img

最后

学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后给大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

如果需要可以点击链接免费领取或者滑到最后扫描二v码

👉[CSDN大礼包:《python学习路线&全套学习资料》免费分享]安全链接,放心点击

👉Python学习大纲👈

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

👉Python实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

在这里插入图片描述

在这里插入图片描述

👉Python书籍和视频合集👈

在这里插入图片描述

👉Python面试刷题👈

👉Python副业兼职路线👈

在这里插入图片描述

这份完整版的Python全套学习资料已经上传CSDN,朋友们如果需要可以点击链接免费领取或者保存图片到wx扫描二v码免费领取保证100%免费

👉[CSDN大礼包:《python学习路线&全套学习资料》免费分享]安全链接,放心点击

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值