Py之PandasAI:PandasAI库的简介、安装、使用方法之详细攻略

PandasAI是一个Python库,它扩展了pandas的功能,允许用户通过自然语言查询数据。安装PandasAI后,用户可以询问如在DataFrame中找到所有列值大于5的行等问题,并能直接绘制图表。此外,PandasAI还支持处理多个数据框架并回答相关问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Py之PandasAI:PandasAI库的简介、安装、使用方法之详细攻略

目录

PandasAI库的简介

PandasAI库的安装

PandasAI库的使用方法

1、基础用法

(1)、在DataFrame中找到所有列值大于5的行

(2)、绘图

2、进阶用法

(1)、将多个数据框架传递给PandasAI并询问与之相关的问题


PandasAI库的简介

PandasAI被设计为与pandas一起使用。它使pandas具有对数据进行自然语言提问的能力。PandasAI是一个为pandas添加生成式人工智能功能的Python库,pandas是一种流行的数据分析和处理工具。它被设计为与pandas一起使用,并不是其替代品。

GitHub官网GitHub - gventuri/pandas-ai: Pandas AI is a Python library that integrates generative artificial intelligence capabilities into Pandas, making dataframes conversational

PandasAI库的安装

pip install pandasai



pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandasai

PandasAI库的使用方法

1、基础用法

(1)、在DataFrame中找到所有列值大于5的行

可以向PandasAI询问,在DataFrame中找到所有列值大于5的行,并返回只包含这些行的DataFrame

import pandas as pd
from pandasai import PandasAI

# Sample DataFrame
df = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
    "happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 5.12]
})

# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token="YOUR_API_TOKEN")

pandas_ai = PandasAI(llm)
pandas_ai(df, prompt='Which are the 5 happiest countries?')

(2)、绘图

pandas_ai(
    df,
    "Plot the histogram of countries showing for each the gdp, using different colors for each bar",
)

2、进阶用法

(1)、将多个数据框架传递给PandasAI并询问与之相关的问题

import pandas as pd
from pandasai import PandasAI

employees_data = {
    'EmployeeID': [1, 2, 3, 4, 5],
    'Name': ['John', 'Emma', 'Liam', 'Olivia', 'William'],
    'Department': ['HR', 'Sales', 'IT', 'Marketing', 'Finance']
}

salaries_data = {
    'EmployeeID': [1, 2, 3, 4, 5],
    'Salary': [5000, 6000, 4500, 7000, 5500]
}

employees_df = pd.DataFrame(employees_data)
salaries_df = pd.DataFrame(salaries_data)


llm = OpenAI()
pandas_ai = PandasAI(llm)
pandas_ai([employees_df, salaries_df], "Who gets paid the most?")

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一个处女座的程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值