pandas 学习打卡 02

索引

pandas索引的功能纷繁复杂, 不是一时半会儿能掌握, 因此本人倾向于偷懒, 就记住简单常用的(复杂的= 不常用) 哈
首先是位置三件套, iloc., loc, [], 还有一个ix不推荐
助教提到的通用原则:
行用loc, 列用[], 位置用iloc
条件用bool/ query, 标量用 at/iat
相当精辟

query查询用起来就跟excel的筛选一样

关于行索引方面, 单层多层太复杂了, 一般数据处理用到的不多, 不深入研究. 记住几个:
where(1,2) 第一个参数为布尔型, 第二个参数为填充参数. 当缺失第二个参数时, 则将不满足条件的记录修改为NaN
query函数中的布尔表达式中,下面的符号都是合法的:行列索引名、字符串、and/not/or/&/|/~/not in/in/==/!=、四则运算符
df.query(’(Address in [“street_6”,“street_7”])&(Weight>(70+10))&(ID in [1303,2304,2402])’)

灵魂拷问

1. 问题

【问题一】 如何更改列或行的顺序?如何交换奇偶行(列)的顺序?

列顺序, 想到比较笨的方法,比如更换AB列, 先增加C列, 把让 C=A
,然后A=B, B=C, 最后drop C…感觉回到了c++
交换 df 的奇偶列, 参照上边的方法, 外边增加一个for循环
for i in range(0, df.shape[1]) shape 取1 代表列的奇偶互换, 取0 则是行的互换.

【问题二】 如果要选出DataFrame的某个子集,请给出尽可能多的方法实现。

.iloc: index, columnames; .loc: 行列位置

【问题三】 query函数比其他索引方法的速度更慢吗?在什么场合使用什么索引最高效?

灵魂拷问啊, 太难了… 求答案

【问题四】 单级索引能使用Slice对象吗?能的话怎么使用,请给出一个例子。
【问题五】 如何快速找出某一列的缺失值所在索引?

df[df[‘xxx’].isnull()].index
先生成是否缺失值的bool型序列, 然后通过df[] 引用, 再取index

【问题六】 索引设定中的所有方法分别适用于哪些场合?怎么直接把某个DataFrame的索引换成任意给定同长度的索引?

太难了

【问题七】 多级索引有什么适用场合?

太太太难了

【问题八】 什么时候需要重复元素处理?

hum…在处理是否存在重复记录的时候, 需要用到查重.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。
当你开始学习pandas时,以下是一个简单的学习路线: 1. 学习Python基础知识:在使用pandas之前,建议先掌握Python的基本语法和数据结构,例如列表、字典和函数等。 2. 安装pandas库:使用pip或conda等工具安装pandas库,并确保安装正确。 3. 学习pandas的数据结构:pandas主要提供了两种数据结构,即Series和DataFrame。了解它们的特点、创建方式和基本操作方法。 4. 数据导入与导出:学习如何从不同的数据源(如CSV、Excel、数据库等)中导入数据到pandas的DataFrame中,并将处理后的数据导出。 5. 数据清洗与预处理:学习如何处理缺失值、重复值、异常值等数据清洗操作,并进行数据类型转换、重命名列名等预处理操作。 6. 数据选择与过滤:学习如何使用pandas提供的方法选择和过滤DataFrame中的数据,包括使用标签、位置、条件等进行选择。 7. 数据排序与排名:学习如何对DataFrame中的数据进行排序和排名操作,以便更好地理解和分析数据。 8. 数据聚合与分组:学习如何使用pandas进行数据聚合和分组操作,包括使用聚合函数、分组键等进行数据分析。 9. 数据合并与连接:学习如何使用pandas进行多个DataFrame的合并和连接操作,以便进行更复杂的数据分析和处理。 10. 数据可视化:学习如何使用pandas结合matplotlib或其他可视化库进行数据可视化,以便更直观地展示和分析数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值