吐槽--pandas模块!!

Jo乔戈里

于 2024-09-30 14:18:09 发布

阅读量167

点赞数 2

文章标签： pandas

本文链接：https://blog.csdn.net/a494665/article/details/142655319

版权

有时候用别人模块还挺糟心的，作为主流的数据分析模块，pandas就有点让人捉摸不透的行为

似乎是因为异常处理的一些不完备性导致的。

代码如下, 其中的data_frame就是pandas.DataFrame对象

self.data_frame[field_name] = self.data_frame[field_name].dropna()
# 或者: self.data_frame[field_name].dropna(inplace=True)

直观上看，这句代码应该会将self.data_frame中field_name字段中的nan值去除掉，事实上，如果

self.data_frame中field_name字段真的有nan值，这段代码对self.data_frame本身不会有任何反应。这是由于这样的直接赋值语句有一个前提条件，就是赋值的pandas.Series对象的长度必须和pandas.DataFrame对象的行数一致；但是，这样一段代码运行居然不会报错!!! 显然pandas内部直接吞噬处理了这个错误，这导致初次接触者深感疑惑；后面发现:

self.data_frame.dropna(subset=[field_name], inplace=True)

这样的代码却能凑效。通过打印才发现，下面的代码会将data_frame中field_name中存在nan值的行直接舍去；这和直接赋值的行为是不同的。
简单总结：对pandas.DataFrame某一列直接赋值是不会舍去行的! 而且报错也不会显示出来!

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Jo乔戈里

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

50个pandas高频操作汇总_50个pandas 高频使用

2401_84264583的博客

04-28

701

在实际的渗透测试过程中，面对复杂多变的网络环境，当常用工具不能满足实际需求的时候，往往需要对现有工具进行扩展，或者编写符合我们要求的工具、自动化脚本，这个时候就需要具备一定的编程能力。对于数值列，实际使用的时候可能需要根据指定的范围，将这些数值变为标签值，如衡量产品的指标及格、不及格，成绩是否优秀等。恭喜你，如果学到这里，你基本可以从事一份网络安全相关的工作，比如渗透测试、Web 渗透、安全服务、安全分析等岗位；注意这里的统计是参照所有列来的，只有两行完全相同才会判断为重复行，所以统计的结果是 1。

50道练习实践学习Pandas！

2401_84616585的博客

04-26

953

方法二。

参与评论您还未登录，请先登录后发表或查看评论

python数据分析基础007 -利用pandas带你玩转excel表格（中上篇）

04-29

898

🐚作者简介：苏凉（专注于网络爬虫，数据分析）👑名言警句：海阔凭鱼跃，天高任鸟飞。📰要是觉得博主文章写的不错的话，还望大家三连支持一下呀！！！🍺前言上篇文章带着大家一起学习了在pandas中如何对excel表格进行创建和修改，还有一些基本的操作，接下来我们一起再深入的去了解pandas在excel中其他的一些有趣的操作吧！！往期回顾：1.2.3.4.5.6.🍀（一）在pandas中对excel进行函数填充🍒1.在excel中进行函数填充。

Pandas - 数据分组统计_pandas分组计数(1)

2401_84573531的博客

06-20

279

示例3:求各二级分类的七天点击量。首先按“二级分类”分类，而后进行分组统计求和。

2024年最全Pandas - 数据分组统计_pandas分组计数，这操作真香

2401_84181731的博客

05-05

561

df1 = df1.groupby(‘二级分类’)[‘七天点击量’].sum()

2401_84181975的博客

05-02

280

创建一个Series对象，然后将Series对象传给groupby()函数实现数据分组。Series对象内放索引+值：如’北京出库销量’，对应值’北上广’。Python也可以实现像SQL中的分组聚合运算操作，主要通过groupby()函数与agg()函数实现。1.统计一月份销售数据中，购买次数最多的产品，及其人均购买数，人均花费，总购买数，总花费。2.以’一级分类’分组，求分组后’七天点击量’的平均值与和，求’订单预定’的和。1. 以’一级分类’分组，求分组后的平均值与和。

2024年大数据最全Pandas - 数据分组统计_pandas分组计数(2)

2401_84184638的博客

05-02

384

Pandas库相关用法总结【万字梳理，用法描述+代码示例结果，详细实用！

HUAXIAL的博客

04-26

763

作为一名运筹优化算法小白，在实习期间主要基于python语言开发一个自动化智能排程项目的算法，在开发定制化的元启发式算法过程中，数据预处理与清洗、数学模型的抽象化以及调用OR-tools求解器建模占了大头。而在使用pandas库处理数据过程中，一开始用的时候要么忘记对应的用法，要么理解错误某些方法和对象的底层运行逻辑，也是因为自己的不熟练，走了贼多弯路，写代码半小时，小问题debug代码花半天。最近算法部署上线稳定后，也想抽空来梳理梳理常用的pandas库用法以及遇到的小坑，希望看到的小伙伴能少走些弯路。

2401_84240129的博客

04-19

1073

这是最常用的方法，可以读取Excel文件，并将其转换为Pandas数据框。读取完Excel文件后，将其转换为Pandas数据框，并将结果赋值给变量。读取完Excel文件后，将其转换为Pandas数据框，并将结果赋值给变量。读取完Excel文件后，将其转换为Pandas数据框，并将结果赋值给变量。读取完Excel文件后，将其转换为Pandas数据框，并将结果赋值给变量。读取完Excel文件后，将其转换为Pandas数据框，并将结果赋值给变量。可以读取Excel文件中的记录，并将其转换为Pandas数据框。

最新Python数据分析：pandas读取和写入数据_pandas写入

2401_84563179的博客

05-03

1017

不知道你们用的什么环境，我一般都是用的Python3.6环境和pycharm解释器，没有软件，或者没有资料，没人解答问题，都可以免费领取（包括今天的代码），过几天我还会做个视频教程出来，有需要也可以领取~给大家准备的学习资料包括但不限于：Python 环境、pycharm编辑器/永久激活/翻译插件python 零基础视频教程Python 界面开发实战教程Python 爬虫实战教程Python 数据分析实战教程python 游戏开发实战教程Python 电子书100本。

Python文本数据互相转换（pandas and win32com）_pandas win32com

2401_84558914的博客

05-02

937

这里需要特别注意的是，SaveAs为另存文件，即可以不需要创建文件，另一个是打开指定文档，这里如果你不需要存入一个文档的话，就只需要打开一个文档存到另一个文档也可以，这里可以doc可以转换docx文件。当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

python3 tkinter和pandas学生信息管理系统_pandas 与tk

m0_60635321的博客

04-26

407

报表页面的绩点gpa的计算方式现在没有根据各科的课程学分计算，默认所有课程学分一致不是很合理。此片段从其他博客修改过来，找不到源博客源了，作为tkinter布局的demo。可以注销回到登录界面，或者直接退出关闭窗口。下，此处randolph为我的用户名。工具类，用来放常调用的通用工具方法。各功能页面及其数据处理功能的集成。

24远景能源-动力，10月最后一周面试！【NTAKYsW】

2301_79125642的博客

10-28

564

挫折会来，也会过去，热泪会流下，也会收起。今年跳槽阿里淘天，在面试过程中，总结了包括阿里，腾讯，字节，商汤，华为等十几家互联网和AI公司的面经以及平时我的学习成果。二面，候场大概两个小时多一点，由于中午才到我，面试时间只有5分钟，而且问的问题都是东一榔头西一棒槌，根本不追问，我想好的一些解释一个字儿没说估计g了，没荣誉没竞。康龙化成，宁德时代，蓝月亮，得物，蓝禾，真我手机，三七互娱，顺丰，奇安信24秋招①康龙化成【岗位】生物科学，临床，大分子，CMC，分析，合成，职能运营【一键内。

vtk-9.3.0-cp312-cp312-win_amd64.whl

10-07

vtk-9.3.0-cp312-cp312-win_amd64.whl

基于JavaWeb+Mysql 实现的网上电子购物城项目，实现展示商品、购买商品、提交订单、持久化保存到数据库等基本功能

10-07

【作品名称】：基于JavaWeb+Mysql 实现的网上电子购物城项目，实现展示商品、购买商品、提交订单、持久化保存到数据库等基本功能【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。【项目介绍】：使用技术 IDE：Eclipse 数据库：MySQL 数据源：C3P0 JDBC 工具：DBUtils 前端框架：Bootstrap Ajax 解决方案：jQuery + JavaScript + JSON + google-gson 快速上手在你的MySQL中创建一个名为estore的数据库（字符编码gb2312），导入使用我提供的estore.sql 使用eclipse导入项目用到的jar包在WEB-INF/lib目录下，记得添加tomcat的jar包，build path即可修改src/c3p0-config.xml中的数据【资源声明】：本资源作为“参考资料”而不是“定制需求”，代码只能作为参考，不能完全复制照搬。需要有一定的基础能够看懂代码，能够自行调试代码并解决报错，能够自行添加功能修改代码。

自由空间中太赫兹脉冲传播的 1D-FDTD 建模Matlab代码.rar

10-07

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

Mac navicat17-lite 安装包