pandas mysql数据统计_Pandas数据分析 vs SQL统计实践

最新推荐文章于 2024-08-19 10:52:43 发布

MICDEL

最新推荐文章于 2024-08-19 10:52:43 发布

阅读量272

点赞数

文章标签： pandas mysql数据统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_26763955/article/details/113958548

版权

本文详细介绍了如何使用Pandas库来实现SQL中的常见统计操作，包括单表查询、聚合操作、连接查询、并集操作、行编号模拟以及更新和删除操作。通过实例对比，帮助数据分析师掌握Pandas在数据处理上的灵活性和实用性。

摘要由CSDN通过智能技术生成

1. 目的：SQL语句的Pandas实现

数据分析师最基础的技能之一：写SQL统计数据；

然..不够使，又须多一个能力，

数据分析师最基础的技能之一：Pandas数据处理

2. 环境

python2.7

python须安装ipython, pandas, numpy, mysqldb

mysql, 并下载练习包employees database

如果不想花时间搭建环境, 我已经在云端搭建了数据学习环境，按照下面的文章最后的说明，申请远程访问权限:

2019年，数据民工的大白话规划

2.1 练习环境

ipython

import MySQLdb

import pandas as pd

conn = MySQLdb.connect(host='127.0.0.1', user='usertest', passwd='usertest',port=3306, db='employees', charset="utf8")

cur = conn.cursor()

df_employees = pd.read_sql('select * from employees', con=conn)

备注:

python MySQLdb连接数据库，为防止查询结果中文乱码，connect参数注意增加charset="utf8"(因为一般表创建字符charset为utf8)

3. SQL实例

下面开始一步一步对照SQL的统计语句和Pandas实现方法：

3.1 单表查询

3.1.1 查询前几行

sql

select * from emloyees limit 10

pandas

# 方法一：

df_employees.iloc[0:10]

# 方法二：

df_employees.head(10)

3.1.2 查询某个字段

sql

select emp_no, birth_date from emloyees

pandas

df_employees[['emp_no', 'birth_date']]

3.1.3 查询某字段前几行

sql

select emp_no, birth_date from emloyees limit 10

pandas

df_employees[['emp_no', 'birth_date']].iloc[0:10]

df_employees[['emp_no', 'birth_date']].head(10)

3.1.4 单字段筛选特殊值

sql

select * from emloyees where hire_date='1986-06-26'

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。