Pandas
文章平均质量分 92
Wanyu677
不知道路在何方 先尽我所及所想所思帮助大家学习认识计算机语言!
展开
-
Python---Pandas万字总结(4)
当我们拿到一大堆数据的时候,如何从数据中迅速的解读出有价值的信息,把繁杂的数据变成容易解读的统计图表并再此基础上进行洞察,这就是数据分析要解决的核心问题。上面的例子中,“统计每个销售区域每个月的销售总额”会产生一个看起来很长的结果,在实际工作中我们通常把那些行很多列很少的表成为“窄表”,如果我们不想得到这样的一个“窄表”,可以使用。,这里的透视表,跟Excel非常相似。一图胜过千言万语,我们对数据进行透视的结果,最终要通过图表的方式呈现出来,因为图表具有极强的表现力,能够让我们迅速的解读数据中隐藏的价值。原创 2024-05-16 17:32:26 · 621 阅读 · 0 评论 -
Python---Pandas万字总结(3)
实际工作中,有些异常值可能是由系统或人为原因造成的,但有些异常值却不是,它们能够重复且稳定的出现,属于正常的极端值,例如很多游戏产品中头部玩家的数据往往都是离群的极端值。当然,在如今信息化发展迅速,数据量庞大的时代,我们拿到的数据未必是质量很好的,可能还需要对数据中的缺失值、重复值、异常值进行适当的处理。通常,从 Excel、CSV 或数据库中获取到的数据并不是非常完美的,里面可能因为系统或人为的原因混入了重复值或异常值,也可能在某些字段上存在缺失值;原创 2024-05-16 08:18:08 · 864 阅读 · 0 评论 -
Python---Pandas万字总结(2)
假设有名为“2022年股票数据.xlsx”的 Excel 文件,里面有用股票代码命名的五个表单,分别是阿里巴巴(BABA)、百度(BIDU)、京东(JD)、亚马逊(AMZN)、甲骨文(ORCL)这五个公司2022年的股票数据,如果想加载亚马逊的股票数据,代码如下所示。方法的参数是一个字符串,它代表了筛选数据使用的表达式,而且更符合 Python 程序员的使用习惯。在完成数据加载后,如果希望释放数据库连接,可以使用下面的代码。的某一行,可以使用整数索引或我们设置的索引,例如取出员工编号为。原创 2024-05-14 17:37:42 · 839 阅读 · 0 评论