数据分析作业9

数据分析作业9

练习1

读取 catNames2.csv 文件,完成需求如下:

  • 找到所有的使用次数超过800的猫的名字
import pandas as pd

# 读取文件数据
catNames = pd.read_csv("catNames2.csv")
catNames = catNames[catNames["Count_AnimalName"]>800]

使用次数大于800的名字

  • 获取用次数最高的名字
catNameIDMax = catNames["Count_AnimalName"].idxmax()
catBestName = catNames["Row_Labels"][catNameIDMax]

输出结果:

'BELLA'

练习2

  • 读取 五粮液2020.xlsx 数据,指定 索引为0列 为 行索引
wly_data = pd.read_excel("五粮液2020.xlsx",index_col=0)

五粮液数据

  • 查看 该数据的基本信息
wly_data.info()

五粮液数据基本信息

  • 计算每一天各指标的差异值
wly_data.diff()

指标差异值

  • 计算其 pre_close 的增长率
  • 将 pre_close 的增长率添加至 wly_data 数据中
# 计算其 pre_close 的增长率
wly_pct_change = wly_data["pre_close"].pct_change()
# 将 pre_close 的增长率添加至 wly_data 数据中
wly_data["pct_change"] = wly_pct_change

增长率

  • 将 pct_change 该列 呈现的 NaN 用0填充
wly_data.fillna(value=0,inplace=True)

填充nan值为0

  • 查看 pre_close 与 pct_change 的相关性
wly_data["pre_close"].corr(wly_data["pct_change"])

输出结果:

-0.02569885399397468
  • 将 pct_change 这列乘以100 保留两位小数 成为百分比
func = lambda x:"%.2f%%"%(x*100)
wly_data["pct_change"] = wly_data["pct_change"].apply(func)

以百分比例形式显示pct_change数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python数据分析作业是使用Python编程语言进行大数据分析的任务。在这个作业中,学生需要运用Python的各种库和工具来处理和分析大规模的数据集。 首先,学生需要了解数据分析的基本概念和技术,以及Python编程语言的基础知识。他们需要学会如何使用Python的数据处理库,例如Pandas和NumPy,来读取、清洗和转换大数据集。 接下来,学生将学习如何使用Python的数据可视化库,例如Matplotlib和Seaborn,来创建图表和可视化工具,以便更好地理解和解释数据集中的模式和趋势。这对于他们能够进行有意义的数据分析和报告至关重要。 此外,学生还需要学习如何使用Python的机器学习和统计建模库,例如Scikit-learn和Statsmodels,来构建预测模型和进行统计分析。这些模型和分析将帮助他们从数据中发现有用的信息和洞察,并支持他们在基于数据的决策和策略制定中做出明智的选择。 最后,学生需要通过实际动手完成各种练习和项目,以应用他们所学的知识和技能。这些项目可能涉及到数据集的获取和清理、数据的可视化和探索、模型的构建和评估,以及最终的报告和展示。 总之,Python数据分析作业是一个全面的任务,要求学生掌握Python编程语言和数据分析技术的基础,并能够将它们应用于实际的大规模数据集中。通过完成这些作业,学生将能够提高他们的数据分析和问题解决能力,并为将来的数据驱动决策和研究打下坚实的基础。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值