数据处理踩过的坑（不断更新）：

最新推荐文章于 2022-06-24 16:04:53 发布

weixin_34087301

最新推荐文章于 2022-06-24 16:04:53 发布

阅读量158

点赞数

原文链接：https://juejin.im/post/5cb883466fb9a0688539b4d7

版权

1.使用布尔掩码作为索引过滤数据：（4.18）

一、对数组或Series用布尔数组进行过滤，滤去对应位置为False的值，只保留对应位置为True的值：

对数组：
对Series：

二、对DataFrame用布尔数组进行过滤，在False的位置填充缺省值（注意区别）：

此时，若想要在特定的某一列中寻找特定的值：

若想要选取存在绝对值大于1.5的数据的行，通过布尔数组配合any()实现：

总结：若想通过仅布尔数组直接选取特定的值，则布尔数组不能是DataFrame形式

2.DataFrame对象才能使用.join()方法：(4.18)

合并数据集的时候发现报错：

检查发现，

所以，

3.获取DataFrame进行groupby分组后的某一列的两种等效方法：

现在获取按key1分组后的data1这一列数据：

对方法一的理解： 按照groupby()中参数列表对data['data1']这一列进行分组，分组方式与原数据集DataFrame无关，只与groupby()中参数列表有关，故不能省略为groupby('key1')：

对方法二的理解： 先按照groupby()中的参数对原数据集DataFrame进行分组，再从各组中选出data1列，分组方式与原数据集DataFrame有关，故能省略为groupby('key1')：

3.数组拼接时的维度问题：

在拼接数组的时候出现了这么一个错误：

原来是转置后的数组维度与x的维度不匹配，改变创建全一数组的形状或者通过reshape方法可以解决：

拼接成功：

转载于:https://juejin.im/post/5cb883466fb9a0688539b4d7

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34087301

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

数据处理时踩坑总结【持续更新版】

qq_44654498的博客

04-26

970

pandas处理数据时遇到的问题

数据处理遇到的一些问题

weixin_43066801的博客

05-17

919

关于np.concatenate拼接问题描述初学时总是分不清楚np.concatenate中axis的概念，需要理解并记忆问题解决假如输入的是一个二维数组，那么拼接操作时，axis=0则意味着扩充shape[0]的这一维度，也就是说拼出来是“沿着上下在拼” axis=1时，意味着扩充shape[1]的这个维度，也就是说拼出来是“沿着左右在拼” ...

参与评论您还未登录，请先登录后发表或查看评论

数据处理踩过的坑1

comesuh的博客

05-09

146

list_position_name=['网络工程师', '网络工程师', '884-软件测试工程师', '测试工程师', '软硬件测试工程师', '测试工程师','网络工程师', '软件测试', '软件测试（常州）'] list_price_positoin_address = [] for i in list_position_name: address_index = [x for x in range(len(.

数据分析的5个坑,你踩过几个?

weixin_34121304的博客

07-03

328

产品经理所面对的数据，本质上和日常生活中的数据没有太大的差别。简单来说，都是一个量化事物的手段，就像身高、体重一样，都是一个数字指标，它代表了现实存在的事物的一个客观情况。正是因为数据的客观性，让数据变成了发掘问题本质，寻找事物规律所需要用到的最有利的手段之一。但是，数据虽然客观，有时也是会骗人的。在与数据打交道的过程中，我们可能经常会犯一些错误，导...

数据库表名字的坑

weixin_42033925的博客

10-29

285

近期在做一个微信小程序，有一张订单的数据表，我起的名字叫做order，咋一看很正常，感觉和另一个用户表user表没啥区别，但是万万没想到，这个是一个巨大的坑，也是我噩梦的开始！！！我后端使用的是nodejs，代码如下 let sql = "insert into order (nickname) values (?)" 就是这一个order的名字，害得我搞了一下午，一直报下面的错误 You ha...

踩坑MySQL数据表清理

dkjkls的博客

03-09

297

nuke开发钉钉微应用界面踩坑之旅（一）

echo的个人博客

09-25

2998

前言由于公司内部需求，所以要开发一个钉钉微应用。于是我就去钉钉开放平台上看看有没有现成的ui组件库，然后我就发现了Salt Ui,但是这是一个基于react的组件库，如果你已经会react的话，就可以选择这个。但是我不回react呀~所以我考虑之后还是放弃了这个方案，因为react学习成本比较大，所以我现在没有办法去使用。钉钉开发平台里有好多钉钉群的二维码，于是我就加了几个群。群里会有一

Go语言路上踩过的坑.zip

10-05

在学习和应用Go语言的过程中，开发者常常会遇到各种问题，这些“坑”有时会让初学者感到困扰，甚至阻碍进步。本文将围绕Go语言的一些常见问题和陷阱进行详细讲解，帮助你更好地理解和避免这些潜在的问题。 1. **...

美团在Redis上踩过的一些坑-3.redis内存占用飙升

04-23

美团作为一家大型互联网公司，其业务复杂度高，对数据处理的需求也非常大。在使用Redis的过程中，他们遇到了一些问题，特别是关于Redis内存占用飙升的问题。下面我们将深入探讨这个问题以及可能的解决方案。 Redis...

MongoDB在唯品会的使用与踩过的坑.pdf

05-20

3. **可扩展性**：MongoDB支持水平扩展，可以通过添加更多的服务器来增加处理能力和存储容量。 4. **社区支持**：MongoDB拥有活跃的社区支持和丰富的文档资料，这对于问题解决和技术发展非常重要。 #### 二、遇到的...

美团：踩雷好几年，才总结出的数据治理避坑攻略

JavaMonsterr的博客

06-24

238

美团住宿数据治理团队通过多年数仓建设及数据治理的经验沉淀，并结合业务发展阶段对于数据治理的诉求，将治理的思路逐步从专项、表象、问题驱动的治理，转变为自动化、体系化的治理，并从标准化、数字化、系统化三个方向进行了落地与实践。美团住宿业务从2014年上线之后发展多年，历经探索期、进攻期，发展期，并逐步由发展期向变革期过渡。业务从之前的快速扩张阶段进入相对稳定的发展阶段，运营手段转变为精细化运营，同时对数据的成本、效率、安全、价值等方向的要求也越来越高，这些都对数据治理提出了新的要求。图1 住宿业务发展阶段另一方

那些年，我们一起踩过的 “Android 坑”

JackWaiting

07-19

2万+

69、多线程同时访问集合（ConcurrentModificationException）问题现象：多线程同时修改集合时常常容易出现 ConcurrentModificationException ，即便是改成用 Collections.synchronizedCollection() 方法同步也无效。原因分析：当集合正在迭代时，如果进行修改就会出现异常，@问题13 已经说过该问题。而 synch

钉钉踩坑（其他2）

SuperxApple的博客

04-17

937

钉钉镶嵌H5应用：首先下载依赖， index.html <script src="https://g.alicdn.com/dingding/dingtalk-jsapi/2.10.3/dingtalk.open.js"></script> main.js import * as dd from 'dingtalk-jsapi'; if(dd.env.platform...

项目中遇到的各种bug和踩过的坑

weixin_34349320的博客

12-03

237

项目中遇到的各种bug和踩过的坑 zepto 赋值时单位转换问题 zepto 的 animate 方法移动某个元素的位置时，例如修改某个绝对定位的元素的 left 值，要与修改前的值单位一致，修改前如果是像素值，修改后也要是像素值，否则android 手机上将不会出现动画效果，而是直接把元素放到修改后的位置。使用 jQuery 时会进行计算并...

在数据库设计和表创建时，避免挖坑的考虑

谢谢你,慌乱了我的年华

12-27

331

在数据库设计和表创建时，我们首要考虑的就是性能咯，不然的话，在后期数据更新到千亿级别时，再来优化，那成本就加大了。或者说你给后期的开发人员挖了一个大坑吧！考虑到性能，那你在设计的时候会考虑到哪些问题了，下面将来详细的介绍。设计表时要注意： 1 表字段避免null值出现，null值很难查询优化且占用额外的索引空间，推荐默认数字0代替null。 2 尽量使用INT而非BIGINT，如果非负...

SpringDataJpa(四)：四种特殊的查询方法

Sakuraaaaaaa的博客

08-04

892

SpringDataJpa：一、使用jpql查询，使用jpql更新。二、使用原生sql查询。三、方法命名规则查询（推荐使用）。四、使用Specification查询。

dataframe设置两个条件取值