查看DataFrame的数据属性总结:
5、返回到DataFrame
6、查看DataFrame中的数据类型
三、分割:即Excel过滤器
描述性报告是关于数据子集和聚合的,当需要初步了解数据时,通常使用过滤器来查看较小的数据集或特定的列,以便更好的理解数据。
Python提供了许多不同的方法来对DataFrame进行分割,我们将使用它们中的几个来了解它是如何工作的。
1、查看列
包括以下三种主要方法:
- 使用点符号:例如data.column_name
- 使用方括号和列名称:数据[“COLUMN_NAME”]
- 使用数字索引和iloc选择器:data.loc [:,’column_number’]
2、查看多列
3、查看特定行
这里使用的方法是loc函数,其中我们可以指定以冒号分隔的起始行和结束行。注意,索引从0开始而不是1。
4、同时分割行和列
5、在某一列中筛选
6、筛选多种数值
7、用列表筛选多种数值
8、筛选不在列表或Excel中的值
9、用多个条件筛选多列数据
输入应为列一个表,此方法相当于excel中的高级过滤器功能:
10、根据数字条件过滤
11、在Excel中复制自定义的筛选器
12、合并两个过滤器的计算结果
13、包含Excel中的功能
14、从DataFrame获取特定的值
如果想要用特定值查看整个DataFrame,可以使用drop_duplicates函数:
15、排序
对特定列排序,默认升序:
四、统计功能
1、描述性统计
描述性统计,总结数据集分布的集中趋势,分散程度和正态分布程度,不包括NaN值:
描述性统计总结:
五、数据计算
1、计算某一特定列的值
输出结果是一个系列。称为单列数据透视表:
2、计数
统计每列或每行的非NA单元格的数量:
3、求和
按行或列求和数据:
为每行添加总列:
4、将总列添加到已存在的数据集
5、特定列的总和,使用loc函数
或者,我们可以用以下方法:
6、用drop函数删除行
7、计算每列的总和
以上,我们使用的方法包括:
- Sum_Total:计算列的总和
- T_Sum:将系列输出转换为DataFrame并进行转置
- Re-index:添加缺少的列
- Row_Total:将T_Sum附加到现有的DataFrame
8、多条件求和,即Excel中的Sumif函数
9、多条件求和
10、求算术平均值
11、求最大值
12、求最小值
13、Groupby:即Excel中的小计函数
六、DataFrame中的数据透视表功能
谁会不喜欢Excel中的数据透视表呢?它是分析数据的最佳方式,可以快速浏览信息,使用超级简单的界面分割数据,绘制图表,添加计算列等。
现在没有了工作界面,必须用编写代码的方式来输出结果,且没有生成图表功能,但需要我们充分理解数据透视表的精华。
简单的数据透视表,显示SepalWidth的总和,行列中的SepalLength和列标签中的名称。
现在让我们试着复杂化一些:
用fill_value参数将空白替换为0:
可以使用dictionary函数进行单独计算,也可以多次计算值:
七、Vlookup函数
Excel中的vlookup是一个神奇的功能,是每个人在学习如何求和之前就想要学习的。会用vlookup是很迷人的,因为输出结果时像变魔术一样。可以非常自信地说它是电子表格上计算的每个数据的支柱。
不幸的是Pandas中并没有vlookup功能!
由于Pandas中没有“Vlookup”函数,因此Merge用与SQL相同的备用函数。有四种合并选项:
- left——使用左侧DataFrame中的共享列并匹配右侧DataFrame,N/A为NaN;
- right——使用右侧DataFrame中的共享列并匹配左侧DataFrame,N/A为NaN;
- inner——仅显示两个共享列重叠的数据。默认方法;
- outer——当左侧或右侧DataFrame中存在匹配时,返回所有记录。
以上可能不是解释这个概念的最好例子,但原理是一样的。
整个教程到这里就结束啦,正如大家知道的那样,“没有完美的教程存在”,我的教程肯定也是不完美的,但是大家可以自己动手试试,如果大家还知道有什么Python可以替代Excel的地方。
读者福利:知道你对Python感兴趣,便准备了这套python学习资料
👉[[CSDN大礼包:《python兼职资源&全套学习资料》免费分享]](安全链接,放心点击)
对于0基础小白入门:
如果你是零基础小白,想快速入门Python是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!
零基础Python学习资源介绍
- ① Python所有方向的学习路线图,清楚各个方向要学什么东西
- ② 600多节Python课程视频,涵盖必备基础、爬虫和数据分析
- ③ 100多个Python实战案例,含50个超大型项目详解,学习不再是只会理论
- ④ 20款主流手游迫解 爬虫手游逆行迫解教程包
- ⑤ 爬虫与反爬虫攻防教程包,含15个大型网站迫解
- ⑥ 爬虫APP逆向实战教程包,含45项绝密技术详解
- ⑦ 超300本Python电子好书,从入门到高阶应有尽有
- ⑧ 华为出品独家Python漫画教程,手机也能学习
- ⑨ 历年互联网企业Python面试真题,复习时非常方便
👉Python学习路线汇总👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
👉Python必备开发工具👈
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉Python学习视频600合集👈
最后
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!