pandasql可以在Python中运行SQL,对于那些想在Python里使用SQL语句的人来说,pandasql提供了这种方法。
1.安装pandasql
安装pandasql的方法非常简单,你只需要在你的Shell中键入pip install -U pandasql,即
pip install -U pandasql
2. pandasql中的主要函数是sqldf,它接受两个参数,一个便是SQL查询语句,还有一组环境变量globals()或locals()。我们来看个例子。
import pandas as pd
from pandasql import sqldf
books = pd.DataFrame({'书名':['Python编程从入门到实践','Python学习手册','流畅的Python','利用Python进行数据分析','Python编程快速上手'],
'价钱':[89,219,139,119,69]})
# 这里为了方便,我们使用lambda创建了一个表达式
pysqldf = lambda sql : sqldf(sql,globals())
sql = 'SELECT * FROM books WHERE "书名" = "Python编程从入门到实践"'
SQL = pysqldf(sql)
print(SQL)
=======output=======
书名 价钱
0 Python编程从入门到实践 89
这个例子中,我们对"书名"="Python编程从入门到实践"的记录行进行输出,这里再说一下lambda,lambda用来定义一个表达式。具体的使用形式为:
lambda argument_list: expression
这个例子中,我们输入的参数是sql,返回的结果是sqldf对sql的运行结果。