pandas查找值在特定列出现过多少次，返回第一次出现的索引

最新推荐文章于 2023-02-14 17:03:35 发布

锦鲤AI幸运

最新推荐文章于 2023-02-14 17:03:35 发布

阅读量2.8k

点赞数

分类专栏：数据整理数据预处理EDA 文章标签： python pandas 索引

本文链接：https://blog.csdn.net/qq_37700257/article/details/119730788

版权

数据整理同时被 2 个专栏收录

15 篇文章 0 订阅

订阅专栏

数据预处理EDA

15 篇文章 0 订阅

订阅专栏

数据展示

import pandas as pd
import numpy as np
import json
from collections import Counter

data = pd.read_excel("work/Test.xlsx")
rows = data.shape[0] #行数
col = data.shape[1]  #列数
user_index = list(data.columns.values)#行标签
print(user_index, "\n 一共有：{}行，{}列".format(rows, col))
data.head(-3)

部分数据如下所示:

在这里插入图片描述

代码处理

查找特定列，某一个值出现过多少次


def maturity_count(data_col, val):
    """
    data_col : 输入data的某一列 如要输入pid这一列,则输入data.pid
    val : 特定data_col这一列索要查询的value值

    return  : 返回指定列，某一个值(val)出现多少次
    """

    data_pid_dict = data_col.value_counts()
    count = data_pid_dict[val]

    return count

count = maturity_count(data.pid, 7)
print("查找pid这一列中7出现的次数为:{}次".format(count))
count = maturity_count(data.pid, 8)
print("查找pid这一列中8出现的次数为:{}次".format(count))

输出为:
    查找pid这一列中7出现的次数为:3
    查找pid这一列中8出现的次数为:7

查找特定列，某一个值第一次出现的索引

def find_index(data_col, val):

    """
    data_col : 输入data的某一列 如要输入pid这一列,则输入data.pid
    val : 特定data_col这一列索要查询的value值

    输出 : 查询的value值第一次出现的index
    """

    val_list = []
    
    val_list.append(val)
    val_list.append("end")

    index = data_col.isin(val_list).idxmax()
    
    return index

index = find_index(data.pid, 16)
print("查找pid这一列中16第一次出现的索引在:{}".format(index))
index = find_index(data.pid, 8)
print("查找pid这一列中8第一次出现的索引在:{}".format(index))

输出为:
	    查找pid这一列中16第一次出现的索引在:32
	    查找pid这一列中8第一次出现的索引在:3

锦鲤AI幸运

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
pandas查找值在特定列出现过多少次，返回第一次出现的索引

数据展示import pandas as pdimport numpy as npimport jsonfrom collections import Counterdata = pd.read_excel("work/Test.xlsx")rows = data.shape[0] #行数col = data.shape[1] #列数user_index = list(data.columns.values)#行标签print(user_index, "\n 一共有：{}行，{}列".
复制链接

扫一扫