pandas常用数据分析语法（三）：查询

wlsccc

已于 2022-04-28 10:52:23 修改

阅读量1.1k

点赞数

分类专栏：数据分析文章标签：数据分析数据挖掘人工智能

于 2022-02-16 17:45:53 首次发布

本文链接：https://blog.csdn.net/wlsccc/article/details/122968820

版权

数据分析专栏收录该内容

5 篇文章 0 订阅

订阅专栏

pandas常用数据分析语法（三）：查询

#列的频率统计
df_2018['Area ID'].value_counts().head(1).values[0]

筛选某些值

#相同
ChargeGroups_selected = ['Vehicle Theft', 'Robbery', 'Burglary', 'Receive Stolen Property']
#包含
df_6 = df_6.loc[df_6['Address'].str.contains('PICO')]

df_2018[df_2018['Charge Group Description'].isin(ChargeGroups_selected)]

#排除
df_4 = df_4[~df_4['Charge Group Description'].isin(excluded)]

#在范围内
df_6 = df_6.loc[(df_6['Lon']<right1)&(df_6['Lon']>left1)]

分位数

Age.quantile(0.95)

排序

z_scores.abs().sort_values(ascending = False)

分组

df_4.groupby('Charge Group Description')['Age'].mean()

最大最小

op.idxmax()
op.max()
#位置
loca1 = df_6[df_6['Lat']==df_6['Lat'].max()].Location.head(1).values[0]

分列

mp = loca.split(',')
lon = float(mp[0][1:])
lat = float(mp[1][:-1])

df_6['Lon'] = df_6['Location'].str.split(',').str[0].str[1:]

apply

df_5.loc[:,'Location'] = df_5.loc[:,'Location'].apply(within_2km,args=(center,))

数据格式

df_6['Lon'] = df_6['Lon'].astype('float')

df_8['Arrest Date'].astype('str').str.split('-').str[0]

loc

df_8.loc[df_8.loc[:,'Arrest Type Code']=='F']

对bool用sum

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wlsccc

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pandas常用数据分析语法（三）：查询

pandas常用数据分析语法（三）：查询
复制链接

扫一扫

专栏目录

pandas关键字提取_数据分析篇 | Pandas基础用法3

weixin_29603489的博客

01-03

724

函数应用不管是为 pandas 对象应用自定义函数，还是应用其它第三方函数，都离不开以下三种方法。用哪种方法取决于操作的对象是 DataFrame 或 Series ，是行或列，还是元素。表级函数应用：`pipe()`行列级函数应用：apply()聚合 API：`agg()` 与 `transform()`元素级函数应用：`applymap()`表级函数应用虽然可以把 DataFram...

[Pandas基础] Pandas 数据查询

m0_74827981的博客

10-06

2423

Pandas 数据查询的几种方法 1. df.loc方法查询，根据行，列的标签值查询 2. df.iloc方法查询 ,根据行,列的数字位置进行查询 3. df.where方法 4.df.query方法

参与评论您还未登录，请先登录后发表或查看评论

Pandas查询数据的5大方法

qq_41715032的博客

03-22

843

pandas中的数据查询

pandas的简单使用（查询）

qq_55342245的博客

11-25

5107

pandas的简单使用--查询head() 函数loc 函数iloc 函数条件查询简单逻辑模糊查询startswith() 按开头字符串进行查找endswith() 按结尾字符串进行查找contains() 模糊查询不常用的骚操作 df['列名'] 与 df.列名输出结果是一致的。哪怕列名是中文也可以但两个都只能输出一列，如果要输出多列 df[['列1','列2','列3']] head() 函数 # 查看前5行 df.head() # 查看前100行 df.head(100) loc 函数语

pandas常用语句速查（整理中...）

spatial_coder的博客

04-14

520

数据探索 df.sample(nums) 数据集中随机选取nums个。

Pandas查询数据的几种方式

qq_40703593的博客

11-06

1万+

一、Pandas查询数据的几种方法 1.df.loc方法，根据行、列的标签值查询 2.df.iloc方法，根据行、列的数字位置查询 3.df.where方法， 4.df.query方法二、查询数据方法的实现案例注：在查询数据过程中会存在降维的情况，DataFrame中查询出某列或某行为Series类型，从DataFrame和Series中查询出某个值为具体的编程语言中的类型，如 int，float，str等类型 1、df.loc查询数据方法 ①使用单个label值查询数据

python数据科学常用库基本语法.zip

03-18

1. **Pandas**: 是Python中用于数据分析的核心库，提供高效的数据结构DataFrame，便于进行数据清洗、转换、合并和分组等操作。Pandas的基础部分包括如何创建DataFrame和Series，理解索引与列，以及基本的数据过滤和...

常用Python数据分析工具汇总共2页.pdf.zip

10-29

Python是一种广泛应用于数据分析的语言，因其简洁的语法和丰富的库支持而受到数据科学家和分析师的青睐。这份"常用Python数据分析工具汇总共2页.pdf.zip"压缩包文件，很可能包含了一份简明扼要的Python数据分析工具...

Python常用数据分析模块原理解析

09-16

Python数据分析模块是Python在数据科学领域中的核心工具，它们提供了高效的数据处理、分析和可视化功能。以下是关于这些模块的详细解析： 1. **NumPy**： NumPy是Python科学计算的基础，它提供了多维数组对象`...

常用的 Python 库，用于数据分析和可视化.rar

最新发布

05-27

在这个"常用的 Python 库，用于数据分析和可视化"的压缩包中，我们很可能找到了一份关于如何利用Python进行数据处理和展示的重要资料——"常用的 Python 库，用于数据分析和可视化.docx"。在数据分析领域，Python ...

Python数据分析自学入门.pdf

03-15

另一种是安装Anaconda，这是一个包含了众多常用数据分析包的集成环境，适合不想花费太多时间在配置上的用户。安装Anaconda时要注意避免安装路径含有中文或空格。接着，了解Python的数据类型和运算符是学习的基础。...

python pandas常用的查询

weixin_44012722的博客

03-28

1211

一些常用的Pandas查询记录 1.全文搜索 findVal = np.column_stack(dataFrame[col].str.contains('查询的字符串', na=False) for col in dataFrame) findSerise = dataFrame.loc[findVal.any(axis=1)] 这里简单说一下逻辑 dataFrame[col].str.contains(‘查询的字符串’, na=False) for col in dataFrame 这段代码循环查

Pandas查询数据的5种方法

wusiyang001025的博客

07-13

6403

04.pandas查询数据的5种方法按数值，列表，函数，区间，条件的查询方法（1）查询语法 1.df.loc:根据行列的标签值进行查询 2.df.iloc:根据行列的位置进行查询 3.df.where 4.df.query （2）df.loc查询方法 @用单个lable值查询数据 @使用值列表批量查询 @使用数据区间进行范围查询演示 import pandas as pd df=pd.read_csv("文件位置") df.head#查看文件前几行数据 df.set_index('列名索引',imp

pandas 像SQL一样使用WHERE IN查询条件

你不要担心

07-11

3848

pandas 像SQL一样使用WHERE IN查询条件 in newDropList = [9,10,11,12,22,50,51,60,61] newDB = newDB[newDB['groupId'].isin(newDropList)] 直接查询表中groupId列,值为newDropList的记录 not in newDropList = [9,10,11,12,22,50,51,...

pandas实现sql查询_在Pandas中编写高级SQL查询

weixin_26739079的博客

10-13

1548

pandas实现sql查询Being able to skillfully manipulate data with both SQL and pandas, a data analysis library in Python, is a valuable skill to have for data analysts, data scientists and anyone working wit...

对Python中的Pandas进行SQL查询——pandasql

热门推荐

困而学之，学思并重

12-05

2万+

背景众所周知，用SQL语句进行数据查询十分方便，因为跟自然语言更接近。 pandas其实是模仿R语言中的DataFrame设计的一个Python库。 R语言中可以使用sqldf实现SQL查询；pandas中也有类似的库：pandasql。 pandasql介绍 Overview pandasql allows you to query pandas DataFrames using SQL sy

Python pandas.DataFrame.abs函数方法的使用

weixin_42098295的博客

06-11

808

Pandas是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现，它是使Python成为强大而高效的数据分析环境的重要因素之一。本文主要介绍一下Pandas中pandas.DataFrame.abs()方法的使用。原文地址：Python pandas.DataFrame.abs函数方法的使用 ...

使用SQL语句来操作pandas

weixin_42515907的博客

02-24

1012

使用SQL语句来操作pandas 在python里，可以直接使用SQL语句来操作pandas。适用于有些人难以记住pandas中操作dataframe的语句时，SQL对数据表的操作更接近于我们的自然语言。使用的工具包是pandasql。 pandasql中的主要函数是sqldf，可以传入两个参数：一个sql查询语句，还有一组环境变量globals（）或locals（）。 import panda...

pandas查询数据

KyrieHe的博客

05-23

2195

pandas查询数据通过布尔索引有针对的选取原数据的子集、指定行、指定列等。我们先导入一个student数据集： student = pd.read_csv(‘C:\Users\admin\Desktop\student.csv’) 查询数据的前5行或末尾5行 student.head() student.tail() 查询指定的行 studen...

Python数据分析实战指南：麦金尼经典力作

2. Pandas库：重点讲解Pandas，这是Python中最常用的数据分析库，它提供了高效的数据结构DataFrame和Series，以及一系列方便的数据操作和清洗方法。 3. 数据清洗与预处理：阐述如何处理缺失值、异常值，以及如何进行...