![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DataFrame
LLLLLunaaaa
这个作者很懒,什么都没留下…
展开
-
pandas 分组排序并保留原始列
场景需要按照各个省份及全网进行分组,对各个指标的率值进行排序。 其实这一步一般是在sql中完成的,但由于要分组排序的列较多,达30列以上,代码十分不简洁,且连接的数据库为mysql,本身没有row_number() over( paritition by··· ···)的语句,实现起来较为麻烦。而本次的原始数据每日只有5000行左右并不大,故直接用python将数据down下来进行处理。实...原创 2020-01-08 15:31:56 · 3757 阅读 · 0 评论 -
DataFrame 按照字符串长度进行排序 iat 和 iloc两种不同方式的耗时
''' 法一 使用循环'''time1_1 = datetime.datetime.now()clothes['LEN'] = numpy.nanfor row_loc in range(len(clothes)): clothes.iloc[row_loc,12] = len(clothes.iloc[row_loc,1]) clothes.sort_values(by='LEN...原创 2018-07-04 14:52:43 · 2385 阅读 · 2 评论 -
分组随机采样 事例:随机抽取扑克牌
# -*- coding: utf-8 -*-"""Created on Wed Jul 4 17:14:41 2018@author: Administrator"""'''随机采样''''''21点计数H 红桃S 黑桃C 梅花D 方片'''import pandas as pdimport numpy as np# 扑克得分矩阵card_soccer = ...原创 2018-07-05 10:53:26 · 1400 阅读 · 0 评论 -
DataFrame多条件筛选
两种方法:1.使用query()方法,也是自己最常用的方法,数据量大的时候较快,语法较为简单;2.使用df[(df.c1==1) & (df.c2==1)]的格式,注意这里的()不能省略 ,虽然在Python条件判断中 >、<、== 的优先级要高于 and 和 or ,但是在DataFrame多条件运算中并不是这样。在这栽了两次了。...原创 2019-05-16 14:06:39 · 27175 阅读 · 0 评论