【Jupyter Notebook实践】

本文介绍了如何使用Jupyter Notebook结合pandas、matplotlib和seaborn进行数据分析和可视化。通过加载数据集,检查并清洗数据,特别是针对profit列中的非数字值。接着,展示了年份分布的直方图,以及按年份分组绘制平均利润和收入的曲线,揭示了1990年代初期的经济波动。最后,讨论了数据中公司间收入和利润的差异,并指出进一步挖掘的潜力。
摘要由CSDN通过智能技术生成

Test03

Jupyter Notebook实践

%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.read_csv('fortune500.csv')

pandas用于数据处理,matplotlib用于绘图,seaborn使绘图更美观。第一行不是python命令,而被称为line magic。%表示作用与一行,%%表示作用于全文。此处%matplotlib inline 表示使用matlib画图,并将图片输出。
随后,加载数据集。

df = pd.read_csv('fortune500.csv')
df.head()
df.tail()

对数据属性列进行重命名,以便在后续访问

df.columns = ['year', 'rank', 'company', 'revenue', 'profit']

接下来,检查数据条目是否加载完整。

len(df)

从1955至2055年总共有25500条目录。然后,检查属性列的类型。

df.dtypes

其他属性列都正常,但是对于profit属性,期望的结

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值