【SQL / Pandas思考记录】力扣607. 销售员

扣柚

已于 2023-12-14 19:27:18 修改

阅读量376

点赞数 10

分类专栏：力扣题目解析文章标签： sql pandas leetcode 数据库算法

于 2023-12-14 13:09:20 首次发布

本文链接：https://blog.csdn.net/weixin_73108148/article/details/134992850

版权

力扣题目解析专栏收录该内容

100 篇文章 1 订阅

订阅专栏

原题链接

文章目录

SQL与Pandas代码分析与比较
问题描述
SQL代码解析
SQL代码1
SQL代码2

Pandas代码解析
SQL转Pandas思考步骤
SQL代码执行步骤

SQL与Pandas代码分析与比较

本文旨在详细分析并比较在处理数据库查询问题时SQL代码与Pandas代码的差异。我们将以一个具体的算法题为例，探讨如何在SQL和Pandas中实现相同的功能，并分析将SQL查询转换为Pandas操作的思考过程。

问题描述

本例涉及到的问题是：找出没有与特定公司（此例中为"RED"公司）相关订单的所有销售人员的姓名。

SQL代码解析

SQL代码1

SELECT 
    name
FROM
    SalesPerson
WHERE
    SalesPerson.sales_id
    NOT IN (
        SELECT 
            sales_id
        FROM
            Orders
        WHERE
            Orders.com_id = (
                SELECT
                    com_id
                FROM
                    Company
                WHERE 
                    Company.name = 'RED'               
            )
    )

此SQL查询的目的是从SalesPerson表中选择没有向“RED”公司销售过的销售人员的姓名。它的做法较为简单粗暴，通过一个嵌套的子查询来实现，首先在内部子查询中找出与“RED”公司相关的所有订单，然后在外部查询中选择那些不在这些订单中的销售人员。

SQL代码2

SELECT 
    name
FROM
    SalesPerson
WHERE
    SalesPerson.sales_id NOT IN (
        SELECT 
            sales_id
        FROM
            Orders LEFT JOIN Company ON Company.com_id = Orders.com_id
        WHERE
            Company.name = 'RED'    
    )

这个查询与第一个查询相似，但使用了左连接（LEFT JOIN）来关联Orders和Company表，性能更优。这个查询的逻辑是先找出所有与“RED”公司有关的订单，然后选择那些不在这些订单中的销售人员。

Pandas代码解析

import pandas as pd

def sales_person(sales_person: pd.DataFrame, company: pd.DataFrame, orders: pd.DataFrame) -> pd.DataFrame:
    df = pd.merge(orders, company, on='com_id')
    fil = df[df['name'] == 'RED']
    invalid_ids = fil.sales_id.unique()
    valid_sales = sales_person[~sales_person['sales_id'].isin(invalid_ids)]

    return valid_sales[['name']]