第十二章 pandas官方文档0.22中文教程---Tutorials(lessons 1 ),个人渣翻译

这篇博客是pandas官方文档0.22的中文翻译,适合新手入门。主要内容包括创建数据集,从CSV文件导入和导出数据,数据清洗,以及数据分析和展示。通过实例展示了如何使用pandas进行数据操作,如查找最大值,绘制数据图表,并探讨了在数据帧中寻找特定值的挑战。
摘要由CSDN通过智能技术生成

这里写图片描述
Lessons for New pandas Users
给新pandas用户上课。

####01-lesson:导入库——创建数据集——创建dataFrame——从CSV导出到写入CSV——查找最大值——绘制数据。

创建数据–我们首先创建我们自己的数据集进行分析。这将预防让终端用户能阅读本教程,而不需要下载任何文件来复制下面的结果。我们将把这个数据集导出到一个文本文件中,这样您就可以从文本文件中获取一些数据。

获得数据–我们将学习如何在文本文件中读取。这些数据包括婴儿名字和1880年出生的婴儿名字。

准备数据–在这里,我们将简单地查看数据并确保它是干净的。我的意思是,我们将查看文本文件的内容并查找任何异常。这些数据可能包括丢失的数据、数据的不一致或其他看起来不合适的数据。如果找到了,我们就必须决定如何处理这些记录。

分析数据–我们会在特定的年份找到最流行的名字

展示数据–通过表格数据和图表,清楚地向终端用户显示特定年份中最流行的名称。
####创建数据
数据集将包括5个婴儿名字和那一年(1880年)的出生人数

# The inital set of baby names and bith rates
names = ['Bob','Jessica','Mary','John','Mel']
births = [968, 155, 77, 578, 973]

要合并这两个列表,我们将使用zip函数

BabyDataSet = list(zip(names,births))
BabyDataSet

Out[106]: [(‘Bob’, 968), (‘Jessica’, 155), (‘Mary’, 77), (‘John’, 578), (‘Mel’, 973)]
BabyDataSet是一个列表,每一个元素是成对元祖。
我们基本上完成了创建数据集的工作。现在我们将使用pandas库将这些数据导出到一个csv文件中。

df将是一个DataFrame对象。您可以认为该对象以类似于sql表或excel电子表格的格式保存BabyDataSet的内容。让我们看一下df里面的内容。

df = pd.DataFrame(data = BabyDataSet, columns=['Names', 'Births'])
df

数据部分用

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值