第二次课:Pandas
日期:2024.7.15
内容:Pandas入门
课程回放链接:
https://b23.tv/8QxAQMX
课外资料
Joyful Pandas:https://inter.joyfulpandas.datawhale.club/Content/index.html
NUMPY介绍:
NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库 。
Pandas介绍:
Pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
作业一:
提交直播时展示的文件↑
提交要求:
三个TASK的ipynb文件,保留output输出框(评选优秀要写思考题,直接写在对应的cell中即可)
作业二:
口袋妖怪数据集
数据说明
#代表全国图鉴编号,不同行存在相同数字则表示为该妖怪的不同状态
妖怪具有单属性和双属性两种,对于单属性的妖怪,Type 2为缺失值
Total, HP, Attack, Defense, Sp. Atk, Sp. Def, Speed分别代表种族值、体力、物攻、防御、特攻、特防、速度,其中种族值为后6项之和
作业要求
使用conda新建姓名首字母字母缩写的python环境
将列名更换为中文
分别存储单属性与双属性的妖怪 存储为不同csv文件
对于#重复的妖怪只保留第一条记录 并求出第一属性的种类数量和前三数量对应的种类
求第一属性和第二属性的组合种类
找出Total, HP, Attack, Defense, Sp. Atk, Sp. Def, Speed的最大值,平均值,方差,中位数
将HP超过100的替换为high,不足50的替换为low,否则设为mid
对total值进行降序排序并存储为csv文件
提交要求
1.要求在使用姓名首字母缩写conda环境的截图
2.要求的三个csv文件
3.体现完成要求的ipynb文件(有输出框)